gk machine_learning cheatsheet
G検定トップ
> 教師あり・教師なし・強化学習の違い【最終比較まとめ|G検定対策】
まず結論
- 教師あり学習は「正解ラベルを使って学習する手法」
- 教師なし学習は「正解ラベルなしでデータ構造を見つける手法」
- 強化学習は「報酬を最大化する行動を学習する手法」
- G検定では「何が与えられているか」を見れば即判断できる。
直感的な説明
勉強に例えると👇
- 教師あり学習:
👉 答え付きの問題集で勉強 - 教師なし学習:
👉 答えなしで問題の傾向を探す - 強化学習:
👉 試行錯誤して、点数が上がる行動を覚える
👉 答え?構造?報酬?
これが最大の見分けポイント。
定義・仕組み
教師あり学習(Supervised Learning)
- 入力データと正解ラベルのペアで学習
- 予測精度を高めることが目的
代表例:
- 回帰
- 分類
- ロジスティック回帰
- SVM
- ニューラルネットワーク
教師なし学習(Unsupervised Learning)
- 正解ラベルなし
- データの構造・分布を見つける
代表例:
- クラスタリング(k-means、階層型)
- 次元削減(PCA、SVD、オートエンコーダ)
- 異常検知
強化学習(Reinforcement Learning)
- 正解ラベルなし
- 行動 → 報酬 の繰り返しで学習
- 状態・行動・報酬の3要素が重要
代表例:
- Q学習
- DQN
- Actor-Critic
- AlphaGo / AlphaStar
いつ使う?(得意・不得意)
教師あり学習
- 得意:予測・分類
- 不得意:ラベル作成コストが高い
教師なし学習
- 得意:構造理解・前処理
- 不得意:正解が明確でない
強化学習
- 得意:制御・戦略・意思決定
- 不得意:学習に時間がかかる
G検定ひっかけポイント
ここが最重要👇
❌ 教師なし学習は正解がある
- 誤り
- 正解ラベルは存在しない
❌ 強化学習は教師あり学習の一種
- 誤り
- 教師ラベルは使わない
⭕ 正しい判断基準
- ラベルがある → 教師あり
- 構造を探す → 教師なし
- 報酬で評価 → 強化学習
超頻出ワード対応
- 「分類・回帰」→ 教師あり
- 「クラスタリング・次元削減」→ 教師なし
- 「行動・報酬・環境」→ 強化学習
まとめ(試験直前用)
- 教師あり:正解ラベルあり
- 教師なし:構造発見
- 強化学習:報酬最大化
- 何が与えられているかを見る
- ラベル/構造/報酬で即切る
🔗 関連記事
- NISC・IPA・JPCERT/CC・CSIRTの違いまとめ【一発で切れるチートシート】
- データ・AI利活用における留意事項とは?【DS検定リテラシー】
- データを読む・説明する・扱うとは?データリテラシー実践ガイド【DS検定】
- 数理・アルゴリズム・データ活用基礎(オプション)【DS検定対応】
- ④ Assistant Data Scientist(見習い)に求められるビジネス力
🏠 G検トップに戻る