Skip to the content.

G検定トップ > デンドログラムとは?(階層型クラスタリングの可視化)【G検定対策】

まず結論

  • デンドログラム(Dendrogram)とは、階層型クラスタリングの結果を木構造で可視化した図であり、次元削減の手法ではない
  • G検定では「PCAやSVDと同じ扱いをしてしまう誤解」を狙って出題される。

直感的な説明

デンドログラムは、
データ同士がどの順番で、どの距離でくっついていったか」を
木(ツリー)として描いたもの

  • 似ているデータ → 早い段階で合流
  • あまり似ていないデータ → 高い位置で合流

👉 図で“関係性”を眺めるためのものであって、
👉 データを圧縮したり、次元を減らしたりはしない

定義・仕組み

  • デンドログラムは 階層型クラスタリング(Hierarchical Clustering) の結果を表す
  • 横軸:データ(またはクラスタ)
  • 縦軸:クラスタ間の距離(類似度の逆)

手順のイメージ:

  1. 各データを1つのクラスタとして開始
  2. 距離が最も近いクラスタ同士を結合
  3. これを繰り返してツリー構造を作る
  4. その結合過程を可視化したものがデンドログラム

次元削減や特徴変換は一切行わない

いつ使う?(得意・不得意)

得意

  • クラスタ数を事前に決めたくないとき
  • データ同士の関係性を「構造として理解」したいとき
  • クラスタの切り方(どこで分けるか)を検討したいとき

不得意

  • 高次元データの圧縮
  • 特徴量の次元削減
  • 学習モデルへの直接入力

👉 PCA / SVD / オートエンコーダとは役割が違う

G検定ひっかけポイント

  • ❌「デンドログラムは次元削減手法である」
  • ❌「主成分分析(PCA)と同じ目的で使う」
  • ❌「低次元表現を得るための方法」

  • ✅「クラスタリング結果の可視化」
  • ✅「階層型クラスタリングの途中経過を表す」
  • ✅「距離に基づく結合の履歴を示す図」

判断基準
👉「次元を減らす?」と聞かれたら NO
👉「クラスタの関係を図で表す?」なら YES

まとめ(試験直前用)

  • デンドログラム=階層型クラスタリングの可視化
  • 次元削減ではない
  • PCA / SVD / オートエンコーダとは目的が違う
  • G検定では「次元削減と混同」させる選択肢に注意
  • “図・ツリー・可視化”がキーワード

🔗 関連記事


🏠 G検トップに戻る