Skip to the content.

G検定トップ > t-SNE(t-distributed Stochastic Neighbor Embedding)とは?G検定対策

まず結論

  • t-SNEとは、高次元データの近いデータ同士の関係(局所構造)を保ちながら、低次元(2次元・3次元)に可視化するための教師なし次元削減手法
  • G検定では「可視化専用」「分類ではない」「大域構造は保証しない」点が問われる。

直感的な説明

  • クラス写真を並べるとき、

    • 仲の良い友達同士は近く
    • あまり関係ない人は遠く なるように配置したい、というイメージです。
  • t-SNEは、

    • 近い点同士をとにかく近く保つことを最優先にして
    • 平面上に点を並べます。
  • 👉 「近所関係」をきれいに見せる地図を作る手法です。

定義・仕組み

  • t-SNEは、

    • 高次元空間でのデータ点間の類似度を確率として表し
    • 低次元空間でもその確率分布が似るように
    • 配置を最適化する手法です。
  • 特徴:

    • 教師なし学習
    • 局所構造(近傍関係)を重視
    • 大域的な距離関係は保たれない

いつ使う?(得意・不得意)

使われる場面(得意)

  • 高次元特徴量の可視化
  • クラスタ構造の直感的把握
  • モデル内部表現の確認

注意点・不得意

  • クラス分類や予測には使えない
  • 実行ごとに結果が変わることがある
  • 軸やクラスタ間距離に意味はない

G検定ひっかけポイント

  • よくある誤り表現:

    • ❌ 「クラス分類アルゴリズムである」
    • ❌ 「大域的な距離関係を正確に保持する」
  • 正しい理解:

    • 可視化専用
    • 近い点の関係を重視
  • 判断基準:

    • 局所構造を保つ → t-SNE
    • 大域構造を保つ → MDS / PCA

まとめ(試験直前用)

  • t-SNE=局所構造重視の可視化手法
  • 教師なし・次元削減
  • 分類や予測には使わない
  • 大域的距離は信用しない
  • 「近所をきれいに見せる」と覚える

🔗 関連記事


🏠 G検トップに戻る