Skip to the content.

G検定トップ > 標準化(Standardization)とは?G検定対策

まず結論

  • 標準化(Standardization)とは、入力データを平均0・分散1に変換する前処理手法。
  • G検定では白色化・正規化・正則化との違いを文章問題や選択肢で問われる。

直感的な説明

  • テストの点数が「0〜100点」「0〜1000点」などバラバラだと、どれが重要か比べにくいですよね。
  • 標準化は、

    • データの中心を0にそろえ
    • ばらつき具合を同じにする
  • つまり、👉 特徴量のスケールだけを公平にそろえる処理です。

定義・仕組み

  • 標準化とは、各特徴量を

    • 平均が0
    • 分散が1 になるように変換する操作です。
  • 一般に次の変換を行います:

    • (数式は理解不要)平均との差を標準偏差で割る
  • 特徴量間の相関はそのまま残る点が重要です。

いつ使う?(得意・不得意)

使われる場面(得意)

  • ニューラルネットワークへの入力前処理
  • 勾配降下法を使うモデル(NN・SVM・線形回帰など)
  • 特徴量の単位が異なる場合

注意点・不得意

  • 相関を除去したい場合には不十分(→ 白色化)
  • 外れ値の影響を受けやすい

G検定ひっかけポイント

  • よく出る比較:

    • ❌ 正規化:スケーリング全般の総称
    • ❌ 正則化:過学習防止
    • ❌ 白色化:無相関化+標準化
    • ✅ 標準化:平均0・分散1のみ
  • 判断基準:

    • 「平均0・分散1」だけ書いてあれば標準化
    • 「無相関」という言葉があれば白色化

まとめ(試験直前用)

  • 標準化=平均0・分散1にそろえる
  • 相関は消えない
  • 白色化との違いを必ず意識
  • 正則化とは目的が全く違う
  • G検定では文章表現の違いで判断する

🔗 関連記事


🏠 G検トップに戻る