gk 機械学習 頻出
G検定トップ
> 教師なし学習
まず結論
教師なし学習とは、正解ラベルのないデータから、データの構造や特徴を見つけ出す学習方法です。
直感的な説明
答えのない大量のデータを渡されて、
「似ているもの同士をまとめる」「特徴ごとに整理する」
そんな作業を 人の代わりに自動でやってくれる のが教師なし学習です。
例えるなら、
👉 答えの書いていない写真を、見た目が似ている順に分類する イメージです。
代表的な手法・キーワード
クラスタリング
- k-means
- 階層的クラスタリング
- DBSCAN
👉 データを「似ているグループ」に分ける
次元削減
- 主成分分析(PCA)
- t-SNE
👉 情報をなるべく保ったまま、特徴量を減らす
密度推定
- ガウス混合モデル(GMM)
教師あり学習との違い
| 項目 | 教師あり学習 | 教師なし学習 |
|---|---|---|
| 正解ラベル | ある | ない |
| 目的 | 予測・分類 | 構造の発見 |
| 代表例 | 回帰・分類 | クラスタリング |
G検定ひっかけポイント
- k-meansは教師なし学習
- PCAは「次元削減」だが 教師なし学習
- 教師なし学習は「分類問題」とは言わない
→ クラスタリング
よくある勘違い
- ❌ 正解がない=学習できない
→ ⭕ データの構造を学習している - ❌ 教師なし学習は精度評価できない
→ ⭕ 目的に応じた指標は存在する
まとめ(試験直前用)
- 教師なし学習=正解ラベルなし
- 目的は 構造・特徴の発見
- k-means / PCA は超頻出
🔗 関連記事
🏠 G検トップに戻る