Skip to the content.

DS検定トップ > バイアス・バリアンスのトレードオフとは?過学習との関係【DS検定】

まず結論

バイアス・バリアンスのトレードオフとは、モデルを複雑にするとバイアスは下がるがバリアンスが上がる、という関係のことです。
DS検定では、「過学習と未学習(アンダーフィット)の違い」を説明できるかが問われます。

直感的な説明

モデルを「ルールの細かさ」と考えてみましょう。

ルールがざっくり(単純すぎる)

  • データの傾向をうまく表せない
  • どのデータでも同じような予測をする → これは バイアスが大きい状態

ルールが細かすぎる

  • 学習データには完璧に合う
  • 新しいデータではブレやすい → これは バリアンスが大きい状態

つまり、

単純すぎてもダメ
複雑すぎてもダメ

このバランスを取る必要があります。

定義・仕組み

バイアス(Bias)

モデルの「思い込みの強さ」

単純なモデルほど、 本来の関係をうまく表せません。

→ アンダーフィットにつながる

バリアンス(Variance)

データの変化に対する「敏感さ」

複雑なモデルほど、 データのわずかな違いに影響されやすくなります。

→ 過学習につながる

トレードオフとは?

モデルを複雑にすると:

  • バイアス ↓
  • バリアンス ↑

モデルを単純にすると:

  • バイアス ↑
  • バリアンス ↓

この逆方向の関係が「トレードオフ」です。

どんな場面で使う?

① 決定木の深さ調整

  • 浅い木 → 高バイアス
  • 深い木 → 高バリアンス

前回の「過学習と分岐の深さ」の話は、
まさにこの理論です。

② 正則化の理解

  • 正則化を強くする → モデルを単純化 → バイアス増、バリアンス減
  • 正則化を弱くする → 複雑化 → バイアス減、バリアンス増

DS検定ではここが狙われます。

よくある誤解・混同

❌ バイアスが小さいほど良い

→ 小さすぎるとバリアンスが大きくなる可能性があります。

❌ バリアンスは分散のこと

→ 数学的な分散とは違い、 「予測のブレやすさ」という意味です。

❌ トレードオフは決定木だけの話

→ すべての機械学習モデルに共通する概念です。

❌ 過学習 = バイアスが大きい

→ 過学習は バリアンスが大きい状態 です。

ここはよく出題されます。

まとめ(試験直前用)

  • バイアス = モデルの単純さによる誤差
  • バリアンス = データ変動への敏感さ
  • 単純すぎる → 高バイアス(未学習)
  • 複雑すぎる → 高バリアンス(過学習)
  • 両者は逆方向に動く(トレードオフ)

対応スキル項目(AI利活用スキルシート)

  • AIの理解
  • 機械学習の基本理解
  • ★ 機械学習モデルの基本的な仕組みを理解している

🔗 関連記事


🏠 DS検定トップに戻る