gk unsupervised_learning
G検定トップ
> MDS(多次元尺度構成法)とは?G検定対策
まず結論
- MDS(多次元尺度構成法, Multidimensional Scaling)とは、データ間の距離や類似度をもとに、データを低次元空間に配置して可視化する手法。
- G検定では「教師あり学習か?」「分類手法か?」という誤解を狙った選択肢が頻出。
直感的な説明
- たくさんの都市間の距離表だけを渡されて、「地図を描いて」と言われる状況を想像してください。
-
MDSは、
- 「どれとどれが近いか/遠いか」
- という距離関係だけを頼りに
- 2次元や3次元の地図を作る方法です。
- 👉 データの正体は分からなくても、関係性を“見える化”できるのがポイントです。
定義・仕組み
-
MDSは、
- 観測データ間の距離行列(または類似度行列)を入力として
- その距離関係ができるだけ保たれるように
- 低次元空間に点を配置する 次元削減・可視化手法です。
-
特徴:
- 教師データは不要(教師なし学習)
- クラスラベルを使わない
- 分類そのものは行わない
いつ使う?(得意・不得意)
使われる場面(得意)
- 高次元データの可視化
- 類似度・距離に基づくデータ探索
- クラスタの傾向把握
注意点・不得意
- クラス分類アルゴリズムではない
- 次元削減後の軸に明確な意味はない
- 距離の定義に結果が強く依存する
G検定ひっかけポイント
-
よくある誤り表現:
- ❌ 「主にクラス分類問題に用いられる教師あり学習」
-
正しい理解:
- 教師なし学習
- 可視化・次元削減が目的
-
他手法との混同:
- PCA:分散を最大化
- t-SNE / UMAP:局所構造重視
-
判断基準:
- 距離行列から配置 → MDS
- 分類・予測が目的 → MDSではない
まとめ(試験直前用)
- MDS=距離・類似度を保って配置
- 教師なし学習・可視化手法
- 分類アルゴリズムではない
- 距離の保存がキーワード
- 「教師あり」「分類」と書かれたら誤り
🔗 関連記事
- PCAとSVDの関係とは?(数式なしで理解)【G検定対策】
- クラスタリングと次元削減の違い【最終混同対策・G検定】
- デンドログラムとは?(階層型クラスタリングの可視化)【G検定対策】
- 階層型クラスタリングとは?(凝集型・分割型)【G検定対策】
- k-means と階層型クラスタリングの違い【G検定頻出比較】
🏠 G検トップに戻る