gk neural_network cnn
G検定トップ
> インスタンス正規化(Instance Normalization)とは?G検定対策
まず結論
- インスタンス正規化(Instance Normalization)とは、各サンプル(画像)ごとに、チャネル単位で正規化を行う手法です。
- G検定では「どの単位で統計量を計算するか」「バッチサイズに依存するか」が問われます。
直感的な説明
- インスタンス正規化は「1枚の画像だけを見て、その画像の明るさやコントラストを整える」イメージです。
-
他の画像(バッチ内の別サンプル)の影響を受けないため、
- 1枚ずつ処理する場合
- バッチサイズが小さい場合 に向いています。
定義・仕組み
-
インスタンス正規化では、
- サンプルごと
- チャネルごと に平均と分散を計算し、正規化します。
-
数式的には、Batch Normalization と似ていますが、
- バッチ方向の平均・分散を使わない 点が大きな違いです。
いつ使う?(得意・不得意)
得意な場面
- 画像認識・画像生成
- スタイル変換(Style Transfer)
- バッチサイズが1に近い学習
不得意・注意点
- バッチ全体の統計量を活かしたい場合
- 時系列やNLPでは一般的ではない
G検定ひっかけポイント
-
最大のひっかけ
- 「特徴間の相関を除去する」→ ❌(それは無相関化/白色化)
-
よくある混同
- Batch Normalization:バッチ全体・チャネルごと
- Layer Normalization:サンプルごと・全特徴
- Instance Normalization:サンプルごと・チャネルごと
-
選択肢で
- 「バッチサイズに依存しない」→ ⭕
- 「画像認識で使用される」→ ⭕
まとめ(試験直前用)
- インスタンス正規化はサンプル単位
- チャネルごとに正規化
- バッチサイズに依存しない
- 画像処理でよく使われる *
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る