標準化（Standardization）とは？G検定対策 | AI・データサイエンス・IT学習ノート

gk neural_network

G検定トップ＞標準化（Standardization）とは？G検定対策

まず結論

標準化（Standardization）とは、入力データを平均0・分散1に変換する前処理手法。
G検定では白色化・正規化・正則化との違いを文章問題や選択肢で問われる。

直感的な説明

テストの点数が「0〜100点」「0〜1000点」などバラバラだと、どれが重要か比べにくいですよね。
標準化は、
- データの中心を0にそろえ
- ばらつき具合を同じにする
つまり、👉 特徴量のスケールだけを公平にそろえる処理です。

定義・仕組み

標準化とは、各特徴量を
- 平均が0
- 分散が1 になるように変換する操作です。
一般に次の変換を行います：
- （数式は理解不要）平均との差を標準偏差で割る
特徴量間の相関はそのまま残る点が重要です。

いつ使う？（得意・不得意）

使われる場面（得意）

ニューラルネットワークへの入力前処理
勾配降下法を使うモデル（NN・SVM・線形回帰など）
特徴量の単位が異なる場合

注意点・不得意

相関を除去したい場合には不十分（→ 白色化）
外れ値の影響を受けやすい

G検定ひっかけポイント

よく出る比較：
- ❌ 正規化：スケーリング全般の総称
- ❌ 正則化：過学習防止
- ❌ 白色化：無相関化＋標準化
- ✅ 標準化：平均0・分散1のみ
判断基準：
- 「平均0・分散1」だけ書いてあれば標準化
- 「無相関」という言葉があれば白色化

まとめ（試験直前用）

標準化＝平均0・分散1にそろえる
相関は消えない
白色化との違いを必ず意識
正則化とは目的が全く違う
G検定では文章表現の違いで判断する

🔗 関連記事

🏠 G検トップに戻る