Skip to the content.

G検定トップ > 白色化(Whitening)とは?G検定対策

まず結論

  • 白色化(Whitening)とは、入力データを無相関化した上で、平均0・分散1になるように変換する前処理手法。
  • G検定では「標準化・正規化・無相関化との違い」を文章穴埋めで問われることが多い。

直感的な説明

  • 複数の成績(数学・物理・化学)が似た動きをしていると、「どれが本当に効いているのか」分かりにくくなります。
  • 白色化は、

    • まず似た動きをする成分の関係を切り(無相関化)
    • そのあとスケールをそろえる(平均0・分散1)
  • つまり、 👉 特徴量同士のクセを取り除いて、全部を同じ基準にそろえる処理です。

定義・仕組み

  • 白色化(Whitening)とは、入力データに対して

    1. 無相関化(特徴量間の相関を0にする)
    2. 標準化(平均0、分散1にする) を同時に行う正規化手法です。
  • 共分散行列が単位行列になるのが特徴。

  • PCA Whitening や ZCA Whitening などの手法がありますが、 G検定では名前の暗記は不要です。

いつ使う?(得意・不得意)

使われる場面(得意)

  • ニューラルネットワークへの入力前処理
  • 特徴量間の相関が強いデータ
  • 学習の収束を良くしたい場合

注意点・不得意

  • 計算コストが高い
  • ノイズも同時に強調してしまう可能性がある
  • 現代の深層学習では、Batch Normalization などにより 必須ではなくなっている

G検定ひっかけポイント

  • 穴埋め問題でよく出る定型文:

    「(A)とは、入力データを(B)した上で、平均を0、分散を1と変換する正規化法である」

  • 正しい対応:

    • (A)白色化
    • (B)無相関化
  • よくある誤解:

    • ❌ 標準化 → 相関は消えない
    • ❌ 正規化 → スケーリング全般の総称
    • ❌ 正則化 → 過学習対策(全く別)
  • 判断基準:

    • 「無相関化+分散1」がセットで出たら白色化

まとめ(試験直前用)

  • 白色化=無相関化+標準化
  • 特徴量間の相関をなくし、平均0・分散1にする
  • 標準化・正規化・正則化と混同しやすい
  • G検定では文章穴埋めで頻出
  • 「無相関」というキーワードを見逃さない

🔗 関連記事


🏠 G検トップに戻る