gk unsupervised_learning clustering
G検定トップ
> デンドログラムとは?(階層型クラスタリングの可視化)【G検定対策】
まず結論
- デンドログラム(Dendrogram)とは、階層型クラスタリングの結果を木構造で可視化した図であり、次元削減の手法ではない。
- G検定では「PCAやSVDと同じ扱いをしてしまう誤解」を狙って出題される。
直感的な説明
デンドログラムは、
「データ同士がどの順番で、どの距離でくっついていったか」を
木(ツリー)として描いたもの。
- 似ているデータ → 早い段階で合流
- あまり似ていないデータ → 高い位置で合流
👉 図で“関係性”を眺めるためのものであって、
👉 データを圧縮したり、次元を減らしたりはしない。
定義・仕組み
- デンドログラムは 階層型クラスタリング(Hierarchical Clustering) の結果を表す
- 横軸:データ(またはクラスタ)
- 縦軸:クラスタ間の距離(類似度の逆)
手順のイメージ:
- 各データを1つのクラスタとして開始
- 距離が最も近いクラスタ同士を結合
- これを繰り返してツリー構造を作る
- その結合過程を可視化したものがデンドログラム
※ 次元削減や特徴変換は一切行わない
いつ使う?(得意・不得意)
得意
- クラスタ数を事前に決めたくないとき
- データ同士の関係性を「構造として理解」したいとき
- クラスタの切り方(どこで分けるか)を検討したいとき
不得意
- 高次元データの圧縮
- 特徴量の次元削減
- 学習モデルへの直接入力
👉 PCA / SVD / オートエンコーダとは役割が違う
G検定ひっかけポイント
- ❌「デンドログラムは次元削減手法である」
- ❌「主成分分析(PCA)と同じ目的で使う」
-
❌「低次元表現を得るための方法」
- ✅「クラスタリング結果の可視化」
- ✅「階層型クラスタリングの途中経過を表す」
- ✅「距離に基づく結合の履歴を示す図」
判断基準
👉「次元を減らす?」と聞かれたら NO
👉「クラスタの関係を図で表す?」なら YES
まとめ(試験直前用)
- デンドログラム=階層型クラスタリングの可視化
- 次元削減ではない
- PCA / SVD / オートエンコーダとは目的が違う
- G検定では「次元削減と混同」させる選択肢に注意
- “図・ツリー・可視化”がキーワード
🔗 関連記事
- PCAとSVDの関係とは?(数式なしで理解)【G検定対策】
- クラスタリングと次元削減の違い【最終混同対策・G検定】
- 階層型クラスタリングとは?(凝集型・分割型)【G検定対策】
- k-means法とk-NNの違いとは?名前ひっかけ完全対策【G検定頻出】
- k-means法とは?教師なし学習とクラスタリングの基本【G検定対策】
🏠 G検トップに戻る