gk neural_network
G検定トップ
> 標準化(Standardization)とは?G検定対策
まず結論
- 標準化(Standardization)とは、入力データを平均0・分散1に変換する前処理手法。
- G検定では白色化・正規化・正則化との違いを文章問題や選択肢で問われる。
直感的な説明
- テストの点数が「0〜100点」「0〜1000点」などバラバラだと、どれが重要か比べにくいですよね。
-
標準化は、
- データの中心を0にそろえ
- ばらつき具合を同じにする
- つまり、👉 特徴量のスケールだけを公平にそろえる処理です。
定義・仕組み
-
標準化とは、各特徴量を
- 平均が0
- 分散が1 になるように変換する操作です。
-
一般に次の変換を行います:
- (数式は理解不要)平均との差を標準偏差で割る
-
特徴量間の相関はそのまま残る点が重要です。
いつ使う?(得意・不得意)
使われる場面(得意)
- ニューラルネットワークへの入力前処理
- 勾配降下法を使うモデル(NN・SVM・線形回帰など)
- 特徴量の単位が異なる場合
注意点・不得意
- 相関を除去したい場合には不十分(→ 白色化)
- 外れ値の影響を受けやすい
G検定ひっかけポイント
-
よく出る比較:
- ❌ 正規化:スケーリング全般の総称
- ❌ 正則化:過学習防止
- ❌ 白色化:無相関化+標準化
- ✅ 標準化:平均0・分散1のみ
-
判断基準:
- 「平均0・分散1」だけ書いてあれば標準化
- 「無相関」という言葉があれば白色化
まとめ(試験直前用)
- 標準化=平均0・分散1にそろえる
- 相関は消えない
- 白色化との違いを必ず意識
- 正則化とは目的が全く違う
- G検定では文章表現の違いで判断する
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る