データ拡張と正規化（BatchNormなど）の違いとは？【G検定頻出整理】 | AI・データサイエンス・IT学習ノート

最終更新日：2026年7月14日

gk cnn neural_network

G検定トップ＞データ拡張と正規化（BatchNormなど）の違いとは？【G検定頻出整理】

まず結論

データ拡張は「入力データを増やす工夫」、
正規化（Batch Normalizationなど）は「学習を安定させる工夫」であり、目的も役割も全く異なる。
G検定では「いつ・何に作用するか」で切り分ける。

直感的な説明

この2つは、やっている場所が違います。

データ拡張
👉 学習前にデータを増やす
正規化
👉 学習中にネットワーク内部を整える

たとえると、

データ拡張＝問題集を増やす
正規化＝勉強しやすい机と椅子を用意する

という違いです。

定義・仕組み

データ拡張（Data Augmentation）

学習データに変換を加えて データ数・多様性を増やす手法
主に画像データで使用

例：

回転
反転
色変換
RandAugment / AutoAugment など

目的：

過学習の抑制
汎化性能の向上

重要：

データそのものを変える
学習前の処理

正規化（Normalization）

ネットワーク内部の値を整える手法
代表例：Batch Normalization

BatchNormの役割：

各層の出力分布を安定化
勾配消失・爆発の抑制
学習の高速化

重要：

データは増えない
学習中に作用する

いつ使う？（得意・不得意）

データ拡張が効く場面

学習データが少ない
過学習が起きやすい
画像認識タスク

正規化が効く場面

深いニューラルネットワーク
学習が不安定
勾配消失・爆発が問題

G検定ひっかけポイント

ここが超重要です。

よくある誤解

❌「正規化はデータを増やす」
❌「データ拡張は学習を安定させる」
❌「どちらも前処理だから同じ」

正しい判断基準

データ数を増やす → データ拡張
分布を安定させる → 正規化
過学習対策 → データ拡張
勾配対策 → 正規化

問題文に
「回転・反転・色変換」
とあれば データ拡張。

「Batch Normalization」「分布を安定化」
とあれば 正規化。

最終比較表（これだけ見ればOK）

観点	データ拡張	正規化
作用する場所	入力データ	ネットワーク内部
タイミング	学習前	学習中
データ数	増える	増えない
主目的	汎化性能向上	学習安定化
代表例	RandAugment	BatchNorm

まとめ（試験直前用）

データ拡張：データを増やす
正規化：学習を安定させる
役割は完全に別
「いつ・どこで」を見る
混同したら負け

🔗 関連記事

🏠 G検トップに戻る