gk neural_network
G検定トップ
> 正規化(Normalization)とは?G検定対策
まず結論
- 正規化(Normalization)とは、入力データのスケール(範囲)をそろえるための前処理の総称。
- G検定では標準化・白色化・正則化と混同させる選択肢が頻出。
直感的な説明
- 身長(cm)と体重(kg)をそのまま比べると、数値の大きい方に引きずられます。
-
正規化は、
- データを一定の範囲(例:0〜1)に収めて
- 大きさの違いによる影響を減らす
- つまり、👉 値のスケールをそろえるための“箱詰め”作業です。
定義・仕組み
-
正規化(Normalization)とは、
- データの値域を
- あらかじめ決めた範囲(例:0〜1、-1〜1)に 変換する処理の総称です。
-
代表例:
- Min-Max 正規化(0〜1 に収める)
-
平均0・分散1になるとは限らない点が重要。
いつ使う?(得意・不得意)
使われる場面(得意)
- 入力データの範囲を制限したいとき
- 画像データ(画素値 0〜255 → 0〜1)
- 距離に基づく手法(k-NN など)
注意点・不得意
- 外れ値があるとスケールが歪む
- 分布の形は変わらない
- 相関はそのまま残る
G検定ひっかけポイント
-
混同しやすい用語:
- ❌ 標準化:平均0・分散1
- ❌ 白色化:無相関化+標準化
- ❌ 正則化:過学習防止
-
判断基準:
- 「0〜1」「-1〜1」など範囲指定 → 正規化
- 「平均0・分散1」→ 標準化
まとめ(試験直前用)
- 正規化=値の範囲をそろえる
- スケール調整の総称
- 平均0・分散1とは限らない
- 正則化とは目的が違う
- 範囲指定の表現を見たら正規化
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る