Skip to the content.

DS検定トップ > 標本分散と不偏分散の違いとは?【DS検定リテラシー】

まず結論

  • 標本分散は「手元データのばらつき」
  • 不偏分散は「母分散を推定するために補正したばらつき」

DS検定では
「nで割るのか」「n−1で割るのか」を正しく判断できるかが問われます。

直感的な説明

たとえば、社内アンケートで
4人だけの満足度を集めたとします。

この4人のばらつきは分かりますが、
会社全体のばらつきはまだ分かりません。

ここで出てくるのが2つの考え方です。

  • 今ある4人のデータのばらつきをそのまま見る → 標本分散
  • この4人から「会社全体のばらつき」を推定したい → 不偏分散

つまり、

不偏分散は「未来の全体」を見に行くための補正版

というイメージです。

定義・仕組み

標本分散

手元にあるデータの平均からのずれを測る指標です。
データ数 n で割ります。

これは純粋に「このデータの散らばり具合」を表します。

不偏分散

標本分散は、実は少し小さく出る傾向があります。

そこで、

  • n ではなく
  • n−1 で割る

ことで補正します。

この「−1」は自由度と呼ばれます。

直感的には、

標本平均を使った時点で、データの自由さが1つ減る

と理解すれば十分です。

この補正をしたものが、不偏分散です。

どんな場面で使う?

標本分散を使う場面

  • 単に手元データのばらつきを知りたいとき
  • データ分析の記述統計

不偏分散を使う場面

  • 母集団の分散を推定するとき
  • 統計的推定・検定の前提計算

DS検定では
「母分散を推定する」という文脈が出たら
不偏分散を選べるかがポイントです。

よくある誤解・混同

誤解①:不偏分散=母分散

これは誤りです。

不偏分散は
「母分散を推定するための値」です。

母分散そのものではありません。

誤解②:「標本」と書いてあるから n−1 で割る

DS検定ではここを混同させてきます。

  • 標本分散 → n で割る
  • 不偏分散 → n−1 で割る

「標本」という言葉に引きずられないこと。

典型的ひっかけ

選択肢に

  • 「標本分散は母分散の不偏推定量である」

とあったら誤りです。

正しくは

  • 不偏分散が母分散の不偏推定量

です。

まとめ(試験直前用)

  • 標本分散 → n で割る
  • 不偏分散 → n−1 で割る
  • 不偏分散は母分散を推定するための値
  • 「推定」という文脈が出たら不偏分散
  • 不偏分散=母分散ではない

判断基準は
目的が「記述」か「推定」かです。

対応スキル項目(データサイエンス力シート)

  • 統計基礎
  • 記述統計・推定の理解
  • ★ 分散・標準偏差の違いと役割を理解している

🔗 関連記事


🏠 DS検定トップに戻る