Pre-trained Model
Pre-trained Model 講座
学習済モデルを最大限に活用し
マルチモーダルAI技術を体系的かつ実践的に習得
ゼロショット学習を基盤とした最新の生成AI技術に焦点を当て、実践的かつ包括的なアプローチを体系的に習得できるプログラムです。
本講座では、画像分類、画像キャプショニング、画像生成、セグメンテーション、音声認識、音声生成といった多岐にわたるAI技術を網羅しています。各章において、具体的なモデルの実装方法とユースケースを中心に紹介し、受講者が即戦力として活躍できる高度なスキルを提供します。
本講座のゴール
学習済モデルを活用し、異種データを組み合わせたマルチモーダルAI技術を実践的に習得
学習済モデルを活用し、異種データを組み合わせたマルチモーダルAI技術を実践的に習得
画像分類、キャプショニング、生成、セグメンテーション、音声認識・生成など幅広いAI技術を網羅。異なるデータ形式を組み合わせ、分類・予測・生成を行うマルチモーダルAIの実装を学び、即活用できる高度なスキルを習得します。
カテゴリ | エンジニアリング力 |
講座名 | Pre-trained Model |
講座時間 | 1日6時間 |
備考 | DL4US講座のオプションとしておすすめ |
プログラミングスキル |
|
数学 | 高校卒業程度の数学に関する知識 |
受講に必要な前提知識の目安と講座時間

こんな方におすすめ

生成AI関連分野に興味をもち、実務に直結するスキルを身につけたい方
AI技術を活用した新しいビジネスモデルやプロダクトを開発したいビジネスサイドの方
画像生成やキャプショニングの技術を学びたいクリエイターやマーケティング担当者
データ分析やモデル構築に活用したいデータサイエンティスト
カリキュラム
実践を見据えたカリキュラム設計
Step 01:Introduction
詳細:「「ゼロショット学習ゼロショット学習」についての説明
Step 02:画像分類
詳細:
CLIP/Japanese Stable CLIP の実装、解説を行います
Step 03:画像キャプショニング
詳細:
Coca/BLIP & BLIP2/Japanese InstructBLIP Alpha の実装、解説を行います
Step 04:画像生成
詳細:
DALL-E/Japanese Stable Difffusion XL の実装、解説を行います
Step 05:セグメンテーション
詳細:
Segment Anything Model (SAM) の実装、解説を行います
Step 06:Speech-to-text
詳細:
Whisper の実装、解説を行います
Step 07:音声生成
詳細:
VALL-E X の実装、解説を行います
活用事例
音声認識、画像解析、テキスト生成など、多様なAI技術の実践的な活用方法を学び、自社のビジネスやプロジェクトに応用できるスキルを習得
【 音声認識 】
会議音声の文字起こし (議事録作成)
カスタマーサポート、コールセンター業務などでの電話応対記録の文字起こし (問合せ内容の記録)
動画の字幕の自動作成
【 工場での品質管理 】
生産ライン上の商品を定点カメラで撮影し、「潰れている箱」や「汚れている缶」などの説明文を用いて分類し、欠陥品を検出。
【 不適切コンテンツの識別とフィルタリング 】
アップロードされた画像から、暴力的または不適切なコンテンツを説明文を用いて識別し、フィルタリングする。


