Pre-trained Model
Pre-trained Model 講座
Overview
Pre-trained Model 講座
活用事例
音声認識、画像解析、テキスト生成など、多様なAI技術の実践的な活用方法を学び、自社のビジネスやプロジェクトに応用できるスキルを習得
【 音声認識 】
会議音声の文字起こし (議事録作成)
カスタマーサポート、コールセンター業務などでの電話応対記録の文字起こし (問合せ内容の記録)
動画の字幕の自動作成
【 工場での品質管理 】
生産ライン上の商品を定点カメラで撮影し、「潰れている箱」や「汚れている缶」などの説明文を用いて分類し、欠陥品を検出。
【 不適切コンテンツの識別とフィルタリング 】
アップロードされた画像から、暴力的または不適切なコンテンツを説明文を用いて識別し、フィルタリングする。
講座概要
学習済モデルを活用し、異種データを組み合わせたマルチモーダルAI技術を実践的に習得
画像分類、キャプショニング、生成、セグメンテーション、音声認識・生成など幅広いAI技術を網羅。異なるデータ形式を組み合わせ、分類・予測・生成を行うマルチモーダルAIの実装を学び、即活用できる高度なスキルを習得
カテゴリ | エンジニアリング力 |
講座名 | Pre-trained Model |
講座時間 | 1日6時間 |
備考 | DL4US講座のオプションとしておすすめ |
プログラミングスキル |
|
数学 | 高校卒業程度の数学に関する知識 |
Curriculum
Pre-trained Model 講座
Step 01:Introduction
詳細:「「ゼロショット学習ゼロショット学習」についての説明
Step 02:画像分類
詳細:
CLIP/Japanese Stable CLIP の実装、解説を行います
Step 03:画像キャプショニング
詳細:
Coca/BLIP & BLIP2/Japanese InstructBLIP Alpha の実装、解説を行います
Step 04:画像生成
詳細:
DALL-E/Japanese Stable Difffusion XL の実装、解説を行います
Step 05:セグメンテーション
詳細:
Segment Anything Model (SAM) の実装、解説を行います
Step 06:Speech-to-text
詳細:
Whisper の実装、解説を行います
Step 07:音声生成
詳細:
VALL-E X の実装、解説を行います

.png)


