Skip to the content.

DS検定トップ > 決定係数と自由度調整済決定係数の違いとは?【DS検定】

まず結論

  • 決定係数は「モデルがどれだけデータを説明できているか」を表す指標です。
  • 自由度調整済決定係数は「説明変数の数を考慮して、過剰な当てはまりを防いだ指標」です。

DS検定では、
「説明変数を増やすと決定係数はどうなるか?」
「モデル比較ではどちらを見るべきか?」
といった判断を問われることが多いです。

直感的な説明

営業成績を予測するモデルを作るとします。

  • 変数が「広告費」だけのモデル
  • 「広告費+気温+曜日+月+SNS投稿数+…」とどんどん増やしたモデル

説明変数を増やせば、
見かけ上は当てはまりが良くなります。

しかし、それは本当に「良いモデル」でしょうか?

→ ただ無理やり説明しているだけかもしれません。

ここで登場するのが
自由度調整済決定係数です。

「説明変数が増えすぎていないか?」をチェックする役割があります。

定義・仕組み

■ 決定係数(R²)

決定係数は、

モデルがデータのばらつきをどれだけ説明できているか

を表します。

値は 0〜1 の間になり、
1に近いほど「よく説明できている」ことを意味します。

DS検定では
「R²が高い=モデルが優れている」
という単純な判断は危険です。

なぜなら…

説明変数を増やせば、R²は基本的に下がらないからです。

■ 自由度調整済決定係数(Adjusted R²)

自由度調整済決定係数は、

  • サンプル数
  • 説明変数の数

を考慮して補正した指標です。

特徴は次の通りです:

  • 不要な変数を増やすと値が下がることがある
  • モデル比較に向いている

つまり、

「説明変数の数を考慮した、公平な評価指標」

と考えると分かりやすいです。

どんな場面で使う?

■ 決定係数を使う場面

  • 単一モデルの説明力をざっくり確認するとき
  • モデルの当てはまりの度合いを直感的に把握するとき

■ 自由度調整済決定係数を使う場面

  • 説明変数の数が異なるモデル同士を比較するとき
  • 重回帰分析でモデル選択をするとき

DS検定では
「モデルの比較」という文脈が出たら
自由度調整済決定係数を疑うのがポイントです。

よくある誤解・混同

❌ 「決定係数が高い=良いモデル」

→ 変数を増やせば上がるため、過学習の可能性があります。

❌ 「自由度調整済決定係数は常に決定係数より高い」

→ 通常は R²より小さくなる のが一般的です。

❌ 「決定係数は予測精度そのものを表す」

→ あくまで「説明力」です。
予測誤差とは別の概念です。

DS検定では
説明力と予測精度を混同させる選択肢に注意してください。

まとめ(試験直前用)

  • 決定係数は「説明できた割合」
  • 変数を増やせば基本的に上がる
  • モデル比較では自由度調整済決定係数を見る
  • R²=高いほど良い、とは限らない
  • 説明力と予測精度は別物

対応スキル項目(データサイエンス力シート)

  • 数理・統計基礎
  • モデル評価
  • ★ 回帰分析における評価指標の意味を理解している 【本文構成テンプレート(必須)】

まず結論

  • この用語は何かを一文で説明
  • DS検定での位置づけ(何を判断させたい問題か)

直感的な説明

  • 日常例・業務例を使った説明
  • 「なぜ重要か」が感覚的に分かる説明

定義・仕組み

  • 用語の定義をかみ砕いて説明
  • 式がある場合も「何を意味しているか」だけ説明

どんな場面で使う?

  • 使うべき場面
  • 使うと誤解しやすい場面

よくある誤解・混同

  • 混同しやすい用語との違い
  • DS検定での典型的なひっかけ

まとめ(試験直前用)

  • 3〜5行で要点整理
  • 判断基準が思い出せる形でまとめる

【対応スキル項目の出力ルール(必須)】

  • すべての記事の末尾に「対応スキル項目」を必ず出力する
  • 記事のテーマに応じて、以下のいずれかを選択する

① データサイエンス力シート
② ビジネス力シート
③ データエンジニアリング力シート
④ AI利活用スキルシート

特に、AI活用・AI理解・AIの使い方・AIのリスクに関する記事の場合は、 必ず「AI利活用スキルシート」への対応項目を出力すること。

出力形式は以下を厳守する:

【対応スキル項目(○○スキルシート)】

  • スキルカテゴリ名
  • サブカテゴリ名
  • ★ 該当するチェック項目(力シートと完全一致の文言)

※ 必ず ★ を付ける
※ チェック項目の文言は skillcheck ページと完全一致させる
※ 記事テーマに最も適切な1〜2項目に限定する

【AI系記事の特別ルール】

以下のキーワードを含む場合は必ず AI利活用スキルに分類する:

  • AIの活用
  • AIのリスク
  • AIの倫理
  • AIの判断
  • AIの限界
  • AIと人間の役割
  • 生成AI
  • AI導入

迷った場合は AI利活用スキルを優先すること。

【今回追加したい用語】 (ここに、学習したい用語・過去問で迷った概念を書く)

【補足(あれば)】

  • なぜ迷ったか
  • 混同した用語
  • 実務と試験でのズレ

🔗 関連記事


🏠 DS検定トップに戻る