Pre-trained Model | お申込み受付中 |iLect

Pre-trained Model

Pre-trained Model 講座

学習済モデルを最大限に活用し
マルチモーダルAI技術を体系的かつ実践的に習得

ゼロショット学習を基盤とした最新の生成AI技術に焦点を当て、実践的かつ包括的なアプローチを体系的に習得できるプログラムです。

本講座では、画像分類、画像キャプショニング、画像生成、セグメンテーション、音声認識、音声生成といった多岐にわたるAI技術を網羅しています。各章において、具体的なモデルの実装方法とユースケースを中心に紹介し、受講者が即戦力として活躍できる高度なスキルを提供します。

本講座のゴール

学習済モデルを活用し、異種データを組み合わせたマルチモーダルAI技術を実践的に習得

学習済モデルを活用し、異種データを組み合わせたマルチモーダルAI技術を実践的に習得
画像分類、キャプショニング、生成、セグメンテーション、音声認識・生成など幅広いAI技術を網羅。異なるデータ形式を組み合わせ、分類・予測・生成を行うマルチモーダルAIの実装を学び、即活用できる高度なスキルを習得します。

こんな方におすすめ

生成AI関連分野に興味をもち、実務に直結するスキルを身につけたい方
AI技術を活用した新しいビジネスモデルやプロダクトを開発したいビジネスサイドの方
画像生成やキャプショニングの技術を学びたいクリエイターやマーケティング担当者
データ分析やモデル構築に活用したいデータサイエンティスト

カリキュラム

実践を見据えたカリキュラム設計

Step 01：Introduction

詳細：「「ゼロショット学習ゼロショット学習」についての説明

Step 02：画像分類

詳細：
CLIP/Japanese Stable CLIP の実装、解説を行います

Step 03：画像キャプショニング

詳細：
Coca/BLIP & BLIP2/Japanese InstructBLIP Alpha の実装、解説を行います

Step 04：画像生成

詳細：
DALL-E/Japanese Stable Difffusion XL の実装、解説を行います

Step 05：セグメンテーション

詳細：
Segment Anything Model (SAM) の実装、解説を行います

Step 06：Speech-to-text

詳細：
Whisper の実装、解説を行います

Step 07：音声生成

詳細：
VALL-E X の実装、解説を行います

講座情報

カテゴリ	エンジニアリング力
講座名	Pre-trained Model
講座時間	1日6時間
備考	DL4US講座のオプションとしておすすめ
プログラミングスキル	プログラミングについて勉強したことがある（変数、関数、配列、if, for文）なんらかのプログラムを作ったことがある（演習含む）
数学	高校卒業程度の数学に関する知識

受講に必要な前提知識の目安と講座時間

活用事例

音声認識、画像解析、テキスト生成など、多様なAI技術の実践的な活用方法を学び、自社のビジネスやプロジェクトに応用できるスキルを習得

【音声認識】

会議音声の文字起こし (議事録作成)
カスタマーサポート、コールセンター業務などでの電話応対記録の文字起こし (問合せ内容の記録)
動画の字幕の自動作成

【工場での品質管理】

生産ライン上の商品を定点カメラで撮影し、「潰れている箱」や「汚れている缶」などの説明文を用いて分類し、欠陥品を検出。

【不適切コンテンツの識別とフィルタリング】

アップロードされた画像から、暴力的または不適切なコンテンツを説明文を用いて識別し、フィルタリングする。

iLectの受講形式は３つ！

解決したい課題や受講人数、予算に合わせた受講形式をご提案いたします。お気軽にご相談ください。

Enterprise

一社単独開催講座
人材教育コンサルティング

Enterpriseについて

Project
Workshop

受講推薦　
仮想プロジェクト伴走支援

Enterpriseについて

iLect Academy

メンタリング付き e-learning

Enterpriseについて

Pre-trained Model 講座

実践を見据えたカリキュラム設計

Step 01：Introduction

Step 02：画像分類

Step 03：画像キャプショニング

Step 04：画像生成

Step 05：セグメンテーション

Step 06：Speech-to-text