白色化（Whitening）とは？G検定対策 | AI・データサイエンス・IT学習ノート

gk neural_network

G検定トップ＞白色化（Whitening）とは？G検定対策

まず結論

白色化（Whitening）とは、入力データを無相関化した上で、平均0・分散1になるように変換する前処理手法。
G検定では「標準化・正規化・無相関化との違い」を文章穴埋めで問われることが多い。

直感的な説明

複数の成績（数学・物理・化学）が似た動きをしていると、「どれが本当に効いているのか」分かりにくくなります。
白色化は、
- まず似た動きをする成分の関係を切り（無相関化）
- そのあとスケールをそろえる（平均0・分散1）
つまり、 👉 特徴量同士のクセを取り除いて、全部を同じ基準にそろえる処理です。

定義・仕組み

白色化（Whitening）とは、入力データに対して
1. 無相関化（特徴量間の相関を0にする）
2. 標準化（平均0、分散1にする）を同時に行う正規化手法です。
共分散行列が単位行列になるのが特徴。
PCA Whitening や ZCA Whitening などの手法がありますが、 G検定では名前の暗記は不要です。

いつ使う？（得意・不得意）

使われる場面（得意）

ニューラルネットワークへの入力前処理
特徴量間の相関が強いデータ
学習の収束を良くしたい場合

注意点・不得意

計算コストが高い
ノイズも同時に強調してしまう可能性がある
現代の深層学習では、Batch Normalization などにより 必須ではなくなっている

G検定ひっかけポイント

穴埋め問題でよく出る定型文：

「（A）とは、入力データを（B）した上で、平均を0、分散を1と変換する正規化法である」
正しい対応：
- （A）白色化
- （B）無相関化
よくある誤解：
- ❌ 標準化 → 相関は消えない
- ❌ 正規化 → スケーリング全般の総称
- ❌ 正則化 → 過学習対策（全く別）
判断基準：
- 「無相関化＋分散1」がセットで出たら白色化

まとめ（試験直前用）

白色化＝無相関化＋標準化
特徴量間の相関をなくし、平均0・分散1にする
標準化・正規化・正則化と混同しやすい
G検定では文章穴埋めで頻出
「無相関」というキーワードを見逃さない

🔗 関連記事

🏠 G検トップに戻る