Skip to the content.

G検定トップ > k-means法とは?教師なし学習とクラスタリングの基本【G検定対策】

まず結論

  • k-means法とは、教師なし学習に分類される、非階層的クラスタリングの代表的手法である。
  • G検定では「教師なし学習か?階層的か?」の2点が必ず問われる。

直感的な説明

k-meansは、
「データをK個のグループに、自動で分ける方法」です。

やっていることはシンプルで、

  1. グループ数 K を決める
  2. 各グループの中心(重心)を決める
  3. 近いデータを集める
  4. 中心を更新
  5. これを繰り返す

👉 正解ラベルは一切使いません

定義・仕組み

k-means法の特徴は次の通りです。

  • 入力:特徴量データのみ
  • 出力:クラスタ番号
  • 目的:
    • 同じクラスタ内は近く
    • 異なるクラスタ間は遠く

重要な分類:

  • 教師なし学習
    • 正解ラベルが存在しない
  • 非階層的クラスタリング
    • 一度決めたクラスタ構造を段階的に統合・分割しない

いつ使う?(得意・不得意)

得意な場面

  • データの自動グループ分け
  • 顧客セグメンテーション
  • 前処理としてのクラスタリング

苦手・注意点

  • クラスタ数 K を事前に決める必要がある
  • 初期値に依存しやすい
  • 球状クラスタを仮定している

G検定ひっかけポイント

この問題は 用語の組み合わせを正確に言えるか がポイントです。

よくある誤解

  • ❌「教師あり学習」
  • ❌「階層的クラスタリング」
  • ❌「分類問題(Classification)」

正しい判断基準

  • ラベルがない → 教師なし学習
  • 段階的に統合・分割しない → 非階層的
  • 代表例 → k-means

問題文に
「k-means法は(A)に分類され、(B)の代表的手法」
とあれば、

👉 (A)教師なし学習
👉(B)非階層的クラスタリング

まとめ(試験直前用)

  • k-means=クラスタリング手法
  • 教師なし学習に分類
  • 非階層的クラスタリング
  • ラベルは使わない
  • 「教師なし+非階層」で即答

🔗 関連記事


🏠 G検トップに戻る