ds statistics
まず結論
ウェルチのt検定とは、「分散が等しいと仮定できない2つの平均」を比較するための検定です。
DS検定では「分散が等しいかどうか」で通常のt検定と切り分けられるかが問われます。
直感的な説明
例えば、
A社とB社の社員の残業時間の平均を比べたいとします。
しかし、
- A社はばらつきが小さい
- B社はばらつきがとても大きい
という場合、単純なt検定を使うと「ばらつきが同じ」という前提が崩れています。
ウェルチのt検定は、
「ばらつきが違っても大丈夫な平均比較」
と覚えておくとイメージしやすいです。
ビジネスでは、母集団の分散が同じとは限らないため、実務ではこちらが使われることも多いです。
定義・仕組み
通常のt検定(スチューデントのt検定)は、
- 2群の分散が等しい(等分散)
- 正規分布に従う
という前提があります。
一方、ウェルチのt検定は、
- 分散が等しいとは仮定しない
- 標本ごとにばらつきを別々に扱う
という点が違います。
式自体は似ていますが、
自由度の計算方法が異なるのがポイントです。
DS検定では、数式を覚えるよりも、
「等分散を仮定しない平均比較」
と判断できることが重要です。
どんな場面で使う?
使うべき場面
- 2つのグループの平均を比較したい
- 分散が同じとは言えない
- 標本サイズも違う可能性がある
実務では、事前に等分散かどうかが分からないことも多いため、
安全側でウェルチを使うケースもあります。
使うと誤解しやすい場面
- 3群以上の平均比較 → 分散分析(ANOVA)
- 対応のあるデータ → 対応のあるt検定
DS検定では、
「2群か?」「対応ありか?」「分散は等しい前提か?」
という整理が重要です。
よくある誤解・混同
① 通常のt検定との混同
DS検定では、
- 「分散が等しいと仮定する」と書いてあれば → 通常のt検定
- 「分散が等しいとは限らない」と書いてあれば → ウェルチ
という切り分けになります。
選択肢で
「等分散を前提とする」と書いてあれば、ウェルチではありません。
② 分散分析(ANOVA)との混同
ANOVAは「3群以上」の平均比較です。
ウェルチのt検定は「2群のみ」です。
群の数でまず切り分けましょう。
③ 対応のあるt検定との混同
同じ人の前後比較などは「対応あり」です。
ウェルチは独立した2群を前提とします。
DS検定ではここをよく混同させてきます。
まとめ(試験直前用)
- ウェルチ=等分散を仮定しない2群の平均比較
- 通常のt検定は「等分散」が前提
- 群が3つ以上ならANOVA
- 同一対象の前後比較なら対応ありt検定
DS検定では
「分散を等しいと仮定するかどうか」が最大の判断ポイントです。
対応スキル項目(データサイエンス力シート)
- 統計的推測
- 仮説検定
- ★ 適切な統計的検定手法を選択できる
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】