Skip to the content.

G検定トップ > 正規化(Normalization)とは?G検定対策

まず結論

  • 正規化(Normalization)とは、入力データのスケール(範囲)をそろえるための前処理の総称
  • G検定では標準化・白色化・正則化と混同させる選択肢が頻出。

直感的な説明

  • 身長(cm)と体重(kg)をそのまま比べると、数値の大きい方に引きずられます。
  • 正規化は、

    • データを一定の範囲(例:0〜1)に収めて
    • 大きさの違いによる影響を減らす
  • つまり、👉 値のスケールをそろえるための“箱詰め”作業です。

定義・仕組み

  • 正規化(Normalization)とは、

    • データの値域を
    • あらかじめ決めた範囲(例:0〜1、-1〜1)に 変換する処理の総称です。
  • 代表例:

    • Min-Max 正規化(0〜1 に収める)
  • 平均0・分散1になるとは限らない点が重要。

いつ使う?(得意・不得意)

使われる場面(得意)

  • 入力データの範囲を制限したいとき
  • 画像データ(画素値 0〜255 → 0〜1)
  • 距離に基づく手法(k-NN など)

注意点・不得意

  • 外れ値があるとスケールが歪む
  • 分布の形は変わらない
  • 相関はそのまま残る

G検定ひっかけポイント

  • 混同しやすい用語:

    • ❌ 標準化:平均0・分散1
    • ❌ 白色化:無相関化+標準化
    • ❌ 正則化:過学習防止
  • 判断基準:

    • 「0〜1」「-1〜1」など範囲指定 → 正規化
    • 「平均0・分散1」→ 標準化

まとめ(試験直前用)

  • 正規化=値の範囲をそろえる
  • スケール調整の総称
  • 平均0・分散1とは限らない
  • 正則化とは目的が違う
  • 範囲指定の表現を見たら正規化

🔗 関連記事


🏠 G検トップに戻る