gk clustering
G検定トップ
> k-means法とは?教師なし学習とクラスタリングの基本【G検定対策】
まず結論
- k-means法とは、教師なし学習に分類される、非階層的クラスタリングの代表的手法である。
- G検定では「教師なし学習か?階層的か?」の2点が必ず問われる。
直感的な説明
k-meansは、
「データをK個のグループに、自動で分ける方法」です。
やっていることはシンプルで、
- グループ数 K を決める
- 各グループの中心(重心)を決める
- 近いデータを集める
- 中心を更新
- これを繰り返す
👉 正解ラベルは一切使いません。
定義・仕組み
k-means法の特徴は次の通りです。
- 入力:特徴量データのみ
- 出力:クラスタ番号
- 目的:
- 同じクラスタ内は近く
- 異なるクラスタ間は遠く
重要な分類:
- 教師なし学習
- 正解ラベルが存在しない
- 非階層的クラスタリング
- 一度決めたクラスタ構造を段階的に統合・分割しない
いつ使う?(得意・不得意)
得意な場面
- データの自動グループ分け
- 顧客セグメンテーション
- 前処理としてのクラスタリング
苦手・注意点
- クラスタ数 K を事前に決める必要がある
- 初期値に依存しやすい
- 球状クラスタを仮定している
G検定ひっかけポイント
この問題は 用語の組み合わせを正確に言えるか がポイントです。
よくある誤解
- ❌「教師あり学習」
- ❌「階層的クラスタリング」
- ❌「分類問題(Classification)」
正しい判断基準
- ラベルがない → 教師なし学習
- 段階的に統合・分割しない → 非階層的
- 代表例 → k-means
問題文に
「k-means法は(A)に分類され、(B)の代表的手法」
とあれば、
👉 (A)教師なし学習
👉(B)非階層的クラスタリング
まとめ(試験直前用)
- k-means=クラスタリング手法
- 教師なし学習に分類
- 非階層的クラスタリング
- ラベルは使わない
- 「教師なし+非階層」で即答
🔗 関連記事
- デンドログラムとは?(階層型クラスタリングの可視化)【G検定対策】
- 階層型クラスタリングとは?(凝集型・分割型)【G検定対策】
- k-means法とk-NNの違いとは?名前ひっかけ完全対策【G検定頻出】
- k-means と階層型クラスタリングの違い【G検定頻出比較】
🏠 G検トップに戻る