Skip to the content.

G検定トップ > 教師なし学習

まず結論

教師なし学習とは、正解ラベルのないデータから、データの構造や特徴を見つけ出す学習方法です。


直感的な説明

答えのない大量のデータを渡されて、
「似ているもの同士をまとめる」「特徴ごとに整理する」
そんな作業を 人の代わりに自動でやってくれる のが教師なし学習です。

例えるなら、
👉 答えの書いていない写真を、見た目が似ている順に分類する イメージです。


代表的な手法・キーワード

クラスタリング

  • k-means
  • 階層的クラスタリング
  • DBSCAN

👉 データを「似ているグループ」に分ける

次元削減

  • 主成分分析(PCA)
  • t-SNE

👉 情報をなるべく保ったまま、特徴量を減らす

密度推定

  • ガウス混合モデル(GMM)

教師あり学習との違い

項目 教師あり学習 教師なし学習
正解ラベル ある ない
目的 予測・分類 構造の発見
代表例 回帰・分類 クラスタリング

G検定ひっかけポイント

  • k-meansは教師なし学習
  • PCAは「次元削減」だが 教師なし学習
  • 教師なし学習は「分類問題」とは言わない
    クラスタリング

よくある勘違い

  • ❌ 正解がない=学習できない
    → ⭕ データの構造を学習している
  • ❌ 教師なし学習は精度評価できない
    → ⭕ 目的に応じた指標は存在する

まとめ(試験直前用)

  • 教師なし学習=正解ラベルなし
  • 目的は 構造・特徴の発見
  • k-means / PCA は超頻出

🔗 関連記事


🏠 G検トップに戻る