gk machine_learning evaluation
G検定トップ
> 学習曲線(Learning Curve)
まず結論
- 学習曲線は、学習誤差と検証誤差の変化を見るグラフ
- 過学習・未学習・適切な学習状態を判別できる
- 汎化性能を判断するための重要な手がかり
直感的な説明
学習曲線は、
「このモデル、ちゃんと成長してる?」
を 目で確認するグラフ です。
- 練習問題の点数(学習誤差)
- 模試の点数(検証誤差)
を同時に見て、
勉強の仕方が合っているか を判断します。
定義・仕組み
学習曲線とは?
横軸に 学習データ量(または学習回数)、
縦軸に 誤差(または精度) を取ったグラフです。
通常は次の2本を描きます。
- 学習誤差(Training Error)
- 検証誤差(Validation Error)
学習曲線でわかること
未学習(アンダーフィッティング)
- 学習誤差:高い
- 検証誤差:高い
- 2本の差:小さい
👉 モデルが単純すぎる/学習不足
過学習(オーバーフィッティング)
- 学習誤差:低い
- 検証誤差:高い
- 2本の差:大きい
👉 学習データに依存しすぎ
適切な学習状態
- 学習誤差:低い
- 検証誤差:低い
- 2本が近い値で収束
👉 汎化性能が高い状態
学習曲線から取れる対策
未学習のとき
- モデルを複雑にする
- 特徴量を増やす
- 学習回数を増やす
過学習のとき
- 正則化を強くする
- ドロップアウトを使う
- データを増やす
- 早期終了を行う
G検定ひっかけポイント
- ❌「学習曲線は学習誤差だけを見る」→ 誤り
- ❌「検証誤差が高くても学習誤差が低ければOK」→ 誤り
- ✅ 学習誤差と検証誤差の 両方 を見る
- ✅ 2本の差が重要
汎化性能との関係(頻出)
- 検証誤差が低い → 汎化性能が高い
- 学習誤差との差が大きい → 過学習
- 両方高い → 未学習
まとめ(試験直前用)
- 学習曲線=学習の健康診断
- 過学習・未学習を視覚的に判断
- 汎化性能の確認に必須
👉 次は バイアス・バリアンス トレードオフ に進むと理解が一気に深まる。
🔗 関連記事
- A/Bテストとは?データで施策を比較する方法【DS検定】
- マクロ平均・マイクロ平均・重み付き平均の違いとは?【DS検定】
- バイアス・バリアンスのトレードオフとは?過学習との関係【DS検定】
- 決定係数と寄与率とは?回帰モデルの説明力を理解する【DS検定】
- 分類モデルの評価指標の比較とは?【DS検定リテラシー】
🏠 G検トップに戻る