ds statistics
DS検定トップ
> 標本分散と不偏分散の違いとは?【DS検定リテラシー】
まず結論
- 標本分散は「手元データのばらつき」
- 不偏分散は「母分散を推定するために補正したばらつき」
DS検定では
「nで割るのか」「n−1で割るのか」を正しく判断できるかが問われます。
直感的な説明
たとえば、社内アンケートで
4人だけの満足度を集めたとします。
この4人のばらつきは分かりますが、
会社全体のばらつきはまだ分かりません。
ここで出てくるのが2つの考え方です。
- 今ある4人のデータのばらつきをそのまま見る → 標本分散
- この4人から「会社全体のばらつき」を推定したい → 不偏分散
つまり、
不偏分散は「未来の全体」を見に行くための補正版
というイメージです。
定義・仕組み
標本分散
手元にあるデータの平均からのずれを測る指標です。
データ数 n で割ります。
これは純粋に「このデータの散らばり具合」を表します。
不偏分散
標本分散は、実は少し小さく出る傾向があります。
そこで、
- n ではなく
- n−1 で割る
ことで補正します。
この「−1」は自由度と呼ばれます。
直感的には、
標本平均を使った時点で、データの自由さが1つ減る
と理解すれば十分です。
この補正をしたものが、不偏分散です。
どんな場面で使う?
標本分散を使う場面
- 単に手元データのばらつきを知りたいとき
- データ分析の記述統計
不偏分散を使う場面
- 母集団の分散を推定するとき
- 統計的推定・検定の前提計算
DS検定では
「母分散を推定する」という文脈が出たら
不偏分散を選べるかがポイントです。
よくある誤解・混同
誤解①:不偏分散=母分散
これは誤りです。
不偏分散は
「母分散を推定するための値」です。
母分散そのものではありません。
誤解②:「標本」と書いてあるから n−1 で割る
DS検定ではここを混同させてきます。
- 標本分散 → n で割る
- 不偏分散 → n−1 で割る
「標本」という言葉に引きずられないこと。
典型的ひっかけ
選択肢に
- 「標本分散は母分散の不偏推定量である」
とあったら誤りです。
正しくは
- 不偏分散が母分散の不偏推定量
です。
まとめ(試験直前用)
- 標本分散 → n で割る
- 不偏分散 → n−1 で割る
- 不偏分散は母分散を推定するための値
- 「推定」という文脈が出たら不偏分散
- 不偏分散=母分散ではない
判断基準は
目的が「記述」か「推定」かです。
対応スキル項目(データサイエンス力シート)
- 統計基礎
- 記述統計・推定の理解
- ★ 分散・標準偏差の違いと役割を理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】