ds modeling
まず結論
機械学習の解析手法とは、データからパターンを学習し予測や分類を行うアルゴリズムのことです。
DS検定では
教師あり学習
教師なし学習
強化学習
の3分類を理解し、さらに代表的なアルゴリズム名を判断できるかがよく問われます。
選択肢では
「この手法はどの学習タイプに属するか」を判断させる問題が多いです。
直感的な説明
機械学習の手法は、目的によって大きく3つに分かれます。
教師あり学習
→ 正解付きデータで学習する
例
過去の売上データ → 将来の売上を予測
メール → スパムかどうか判定
教師なし学習
→ 正解なしでデータの構造を見つける
例
顧客データを分析して
若年層グループ
ファミリー層
高所得層
のように自然なグループ分けをする。
強化学習
→ 試行錯誤しながら最適な行動を学ぶ
例
自動運転
ゲームAI
ロボット制御
報酬が大きくなる行動を学習していきます。
定義・仕組み
機械学習の代表的な解析手法は次のように整理できます。
教師あり学習の代表手法
教師あり学習では
特徴量(説明変数) → 目的変数
の関係を学習します。
代表アルゴリズム
回帰系(数値を予測)
線形回帰
リッジ回帰
Lasso回帰
例
住宅価格予測 売上予測
分類系(カテゴリを予測)
代表手法
ロジスティック回帰
k近傍法(kNN)
サポートベクターマシン(SVM)
決定木
ランダムフォレスト
勾配ブースティング
実務では
XGBoost
LightGBM
などがよく使われます。
ニューラルネットワーク
人間の神経回路を模したモデル。
画像認識 音声認識 自然言語処理
などで利用されます。
教師なし学習の代表手法
教師なし学習では
データの構造や関係性を見つけます
クラスタリング
似たデータをまとめる
代表手法
k-means
階層クラスタリング
DBSCAN
例
顧客セグメント分析
商品のカテゴリ分け
次元削減
データの特徴を圧縮する
代表手法
主成分分析(PCA)
t-SNE
UMAP
例
データ可視化
特徴量圧縮
強化学習の代表手法
環境の中で
行動 → 報酬 → 学習
を繰り返します。
代表手法
Q学習
Deep Q Network(DQN)
方策勾配法
Actor-Critic
例
AlphaGo
ロボット制御
自動運転
ディープラーニング系の代表手法
DS検定では
ニューラルネットワーク系のモデル名が問われることがあります。
代表例
GAN(Generative Adversarial Network)
生成モデル
例
AI画像生成
データ生成
VAE(Variational Autoencoder)
確率的生成モデル
例
データ生成
潜在空間学習
YOLO
リアルタイム物体検出
例
自動運転
防犯カメラ
CNN
画像認識モデル
例
顔認識
医療画像解析
RNN / LSTM
時系列データ処理
例
音声認識
翻訳
LLM(大規模言語モデル)関連
最近のAIでは
自然言語処理モデルが重要になっています。
代表例
Transformer
LLMの基盤となるモデル
例
GPT
BERT
GPT(Generative Pre-trained Transformer)
生成AIモデル
例
ChatGPT
文章生成
プログラム生成
BERT
理解系モデル
例
検索エンジン
文書分類
どんな場面で使う?
代表的な用途
目的 代表手法
売上予測 線形回帰 顧客分類 k-means 画像認識 CNN 物体検出 YOLO 文章生成 GPT レコメンド ニューラルネットワーク
実務と試験でのズレ
実務では
XGBoost
LightGBM
Deep Learning
が主流です。
しかしDS検定では
ロジスティック回帰
決定木
SVM
など基礎アルゴリズムがよく出題されます。
よくある誤解・混同
誤解①
機械学習=ディープラーニング
これは誤りです。
正しくは
AI └ 機械学習 └ ディープラーニング
誤解②
k-meansは教師あり学習
これは誤り。
教師なし学習です。
誤解③
ロジスティック回帰は回帰
名前に回帰が付いていますが
分類アルゴリズムです。
DS検定ではよく狙われます。
誤解④
YOLOは画像分類
YOLOは
物体検出(Object Detection)
です。
まとめ(試験直前用)
機械学習は 教師あり・教師なし・強化学習 に分類
DS検定では アルゴリズム名 → 学習タイプ を判断させる問題が多い
ロジスティック回帰は分類に注意
k-meansは教師なし学習
GAN・YOLO・Transformerなどは ディープラーニング手法
対応スキル項目(AI利活用スキルシート)
スキルカテゴリ名 AI・人工知能
サブカテゴリ名 機械学習
★ 機械学習にあたる解析手法の名称を3つ以上知っており、手法の概要を説明できる
🔗 関連記事
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アノテーションとは?(AI学習データを作る重要な作業)【DS検定】
- Aprioriアルゴリズムとは?(アソシエーション分析の基本手法)【DS検定】
- アソシエーション分析とは?購買データの関係性を見つける分析【DS検定】
- 共起頻度・支持度・信頼度・リフト値の違いとは?【DS検定】