Skip to the content.

G検定トップ > インスタンス正規化(Instance Normalization)とは?G検定対策

まず結論

  • インスタンス正規化(Instance Normalization)とは、各サンプル(画像)ごとに、チャネル単位で正規化を行う手法です。
  • G検定では「どの単位で統計量を計算するか」「バッチサイズに依存するか」が問われます。

直感的な説明

  • インスタンス正規化は「1枚の画像だけを見て、その画像の明るさやコントラストを整える」イメージです。
  • 他の画像(バッチ内の別サンプル)の影響を受けないため、

    • 1枚ずつ処理する場合
    • バッチサイズが小さい場合 に向いています。

定義・仕組み

  • インスタンス正規化では、

    • サンプルごと
    • チャネルごと に平均と分散を計算し、正規化します。
  • 数式的には、Batch Normalization と似ていますが、

    • バッチ方向の平均・分散を使わない 点が大きな違いです。

いつ使う?(得意・不得意)

得意な場面

  • 画像認識・画像生成
  • スタイル変換(Style Transfer)
  • バッチサイズが1に近い学習

不得意・注意点

  • バッチ全体の統計量を活かしたい場合
  • 時系列やNLPでは一般的ではない

G検定ひっかけポイント

  • 最大のひっかけ

    • 「特徴間の相関を除去する」→ ❌(それは無相関化/白色化)
  • よくある混同

    • Batch Normalization:バッチ全体・チャネルごと
    • Layer Normalization:サンプルごと・全特徴
    • Instance Normalization:サンプルごと・チャネルごと
  • 選択肢で

    • 「バッチサイズに依存しない」→ ⭕
    • 「画像認識で使用される」→ ⭕

まとめ(試験直前用)

  • インスタンス正規化はサンプル単位
  • チャネルごとに正規化
  • バッチサイズに依存しない
  • 画像処理でよく使われる *

🔗 関連記事


🏠 G検トップに戻る