ds statistics
DS検定トップ
> F検定とは?t検定との違いを整理【DS検定リテラシー】
まず結論
F検定とは、主に「分散が等しいかどうか」を検定するための手法です。
DS検定では「平均の差の検定と混同しないか」を判断させる問題でよく使われます。
直感的な説明
2つのクラスのテスト結果を考えてみます。
- クラスA:点数のばらつきが小さい
- クラスB:点数のばらつきが大きい
このとき知りたいのは、
「平均が違うか?」
ではなく
「ばらつき(分散)が違うか?」
F検定は、平均ではなく“ばらつき”を見る検定です。
DS検定では
「何を比べているのか?」を見抜けるかが重要です。
定義・仕組み
F検定は、2つの母集団の分散が等しいかどうかを検定する方法です。
考え方はとてもシンプルで、
- 2つの分散の比を計算する
- その比が「偶然の範囲かどうか」をF分布で判断する
という仕組みです。
ここで大事なのは、
F検定は「分散」を対象にしている
という点です。
平均の差を直接検定するものではありません。
どんな場面で使う?
① 分散が等しいかを確認したいとき
t検定を行う前に、
- 「等分散とみなしてよいか?」
を確認する目的で使われることがあります。
② 分散分析(ANOVA)
3群以上の平均差を検定する分散分析では、
内部的にF統計量を使います。
ただし、ここでも本質は
平均差を分散の比で評価している
という構造です。
よくある誤解・混同
① F検定=平均の差の検定?
これは誤りです。
平均の差を見るのは:
- t検定(小標本)
- z検定(大標本)
F検定は「分散」です。
DS検定では
「2群の平均差を検定する方法はどれか?」
と問われて、F検定を選ばせるひっかけがあります。
② F検定=金融のF検定?
これは全く別物です。
統計のF検定は
F分布を用いた分散の検定です。
名称だけで判断しないことが重要です。
③ サンプルサイズで使い分ける?
t検定とz検定はサンプルサイズで区別されますが、
F検定はその文脈ではありません。
「大標本だからF検定」という判断は誤りです。
まとめ(試験直前用)
- F検定は「分散」を検定する
- 平均の差を直接見るものではない
- t検定・z検定との混同に注意
- 「何を比べているか?」で判断する
問題文に
「分散」「ばらつき」「等分散」
とあればF検定を疑う。
「平均差」と書いてあればF検定ではない。
対応スキル項目(データサイエンス力シート)
- 統計的推定
- 仮説検定の理解
- ★ 適切な統計的検定手法を選択できる
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】