DS4Me
Data Science for me
Overview
Data Science for me
活用事例
統計解析と機械学習を活用して、複雑なデータ問題を解決できる力を養う
データ分析の実務フローに基づいており、学んだ知識をそのまま業務に適用できるように設計された講座です。
(データ前処理 → 統計解析 → モデリング → 評価 → 応用)
業務データを扱うスキルを重視
現場で頻出するライブラリやツールを習得
評価・改善までを含む「モデルのライフサイクル」学習
講座概要
実践的内容で、業務課題解決が可能なデータサイエンティストへ
Pythonの基礎から統計解析・機械学習・ビッグデータ解析を学び、データサイエンティストとして実問題を解決できるスキルを習得。多様なデータ処理や業務効率化を、実践的なワークフローに沿って体系的に学びます
カテゴリ | データサイエンス力 |
講座名 | DS4Me |
講座時間 | 計5日間/1日8時間 プロジェクトワークショップを含む場合、計6日間/1日8時間 |
プログラミングスキル | いずれかの言語でのコーディング経験 |
数学 | 高校レベルの確率 / 統計 / 微積分の基礎知識 |
Curriculum
Data Science for me
Day 01:データサイエンティストの解説、Python 基礎・応用
詳細:
データサイエンティストとは?、データサイエンスプロジェクトのサイクル、実例紹介
Python, 数値演算、文字列操作、制御構文、関数、オブジェクト指向、データ型、組み込み関数、ファイル操作
扱うモデル/テクニック:Python
Day 02:データ前処理
詳細:
データ加工処理:NumPy、配列操作、並び替え、乱数生成、ブロードキャスト、Pandas、データ抽出、データ加工、データ結合、集約演算、時系列データの取り扱い
データ可視化:Matplotlib, グラフの描画、グラフの描画、分析結果の見せ方
扱うモデル/テクニック:Numpy、Pandas、Matplotlib
Day 03:統計的データ分析
詳細:
記述統計と単回帰:Pandas, Seaborn、scikit-learn、データの読み込み、要約統計量、探索的データ分析、単回帰、決定係数
確率・統計:数学的確率、統計的確率、確率変数、大数の法則、中心極限定理、統計的推定、統計的検定
扱うモデル/テクニック:ヒストグラム、分散と標準偏差、線形単回帰分析、統計的確率、ベイズの定理等
Day 04:教師あり学習の基礎、モデル評価
詳細:
機械学習の基礎(教師あり学習):scikit-learn、機械学習概要、重回帰、正則化、ロジスティック回帰、決定木、SVM、k-NN
モデルの検証方法とチューニング方法:モデル評価、ホールドアウト法、交差査検証法、ハイパーパラメータチューニング、混同行列、
ROC曲線、AUC、各種評価指標
扱うモデル/テクニック:ロジスティック回帰、決定木、k-NN、サポートベクターマシン等、ホールドアウト法と交差検証法、ハイパーパラメータチューニング、混同行列、ROC曲線とAUC、回帰モデルの評価指標等
Day 05:モデルの精度向上、教師なし学習の基礎、特徴量エンジニアリング
詳細:
アンサンブル学習:アンサンブル学習、バギング、ブースティング、ランダムフォレスト、勾配ブースティング木
機械学習の基礎(教師なし学習):クラスタリング、k-means、エルボー法、主成分分析
特徴量エンジニアリング:質的変数のエンコーディング、量的変数のスケーリング、量的変数の非線形変換、ビニング、特徴量選択
扱うモデル/テクニック:k-means法、主成分分析等、バギング、ブースティング、ランダムフォレスト、勾配ブースティング等
ビニング、PCAによる特徴抽出、潜在表現の解釈、one-hotエンコーディング、欠損値処理、特徴量選択等

.png)


