gk neural_network
G検定トップ
> 白色化(Whitening)とは?G検定対策
まず結論
- 白色化(Whitening)とは、入力データを無相関化した上で、平均0・分散1になるように変換する前処理手法。
- G検定では「標準化・正規化・無相関化との違い」を文章穴埋めで問われることが多い。
直感的な説明
- 複数の成績(数学・物理・化学)が似た動きをしていると、「どれが本当に効いているのか」分かりにくくなります。
-
白色化は、
- まず似た動きをする成分の関係を切り(無相関化)
- そのあとスケールをそろえる(平均0・分散1)
- つまり、 👉 特徴量同士のクセを取り除いて、全部を同じ基準にそろえる処理です。
定義・仕組み
-
白色化(Whitening)とは、入力データに対して
- 無相関化(特徴量間の相関を0にする)
- 標準化(平均0、分散1にする) を同時に行う正規化手法です。
-
共分散行列が単位行列になるのが特徴。
-
PCA Whitening や ZCA Whitening などの手法がありますが、 G検定では名前の暗記は不要です。
いつ使う?(得意・不得意)
使われる場面(得意)
- ニューラルネットワークへの入力前処理
- 特徴量間の相関が強いデータ
- 学習の収束を良くしたい場合
注意点・不得意
- 計算コストが高い
- ノイズも同時に強調してしまう可能性がある
- 現代の深層学習では、Batch Normalization などにより 必須ではなくなっている
G検定ひっかけポイント
-
穴埋め問題でよく出る定型文:
「(A)とは、入力データを(B)した上で、平均を0、分散を1と変換する正規化法である」
-
正しい対応:
- (A)白色化
- (B)無相関化
-
よくある誤解:
- ❌ 標準化 → 相関は消えない
- ❌ 正規化 → スケーリング全般の総称
- ❌ 正則化 → 過学習対策(全く別)
-
判断基準:
- 「無相関化+分散1」がセットで出たら白色化
まとめ(試験直前用)
- 白色化=無相関化+標準化
- 特徴量間の相関をなくし、平均0・分散1にする
- 標準化・正規化・正則化と混同しやすい
- G検定では文章穴埋めで頻出
- 「無相関」というキーワードを見逃さない
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る