ds statistics
DS検定トップ
> z検定とは?t検定との違いまで整理【DS検定リテラシー】
まず結論
z検定とは、母平均がある値と同じかどうかを、大きなサンプル数や母分散既知の前提で判断する検定です。
DS検定では「z検定とt検定をどう切り分けるか」が問われることが多いです。
直感的な説明
例えば、ある商品の平均売上が「本当に100個なのか?」を確かめたいとします。
サンプルをたくさん集めて平均を出したとき、
- 100個からどれくらいズレているか?
- そのズレは「偶然」なのか?
- それとも「意味のある差」なのか?
を判断するのが検定です。
z検定は、
「データが十分に多い」または「ばらつきが分かっている」ときに、
ズレがどれくらい異常かを標準化して判断します。
定義・仕組み
z検定は、母平均に関する仮説を検証する方法です。
基本の考え方はシンプルです。
- まず「差はない」という前提(帰無仮説)を立てる
- サンプル平均と仮説平均との差を計算する
- その差を「標準誤差」で割って、どれくらい極端かを見る
この「標準化した値」が z値 です。
z値が大きいほど
「偶然では説明しにくい差」と判断します。
DS検定では、式そのものよりも、
- なぜ標準化するのか
- なぜ正規分布を前提にするのか
を理解しているかが重要です。
どんな場面で使う?
使うべき場面
- サンプル数が十分に大きい場合
- 母分散が既知の場合
- 正規分布が前提にできる場合
注意が必要な場面
- サンプル数が小さい場合
- 母分散が分からない場合
このときは通常、t検定を使います。
DS検定では
「サンプル数が小さいのにz検定を使っている選択肢」は要注意です。
よくある誤解・混同
① z検定とt検定の混同
最も多いひっかけです。
- 母分散が分かっている → z検定
- 母分散が分からない → t検定
と整理しておくと安全です。
DS検定では
「標本分散を使っているのにz検定と書いてある」
といった選択肢が出ることがあります。
② p値との混同
z検定そのものは「方法」です。
p値は「結果の指標」です。
z値をもとにp値を求めます。
「z値=有意差」ではありません。
有意かどうかは、あらかじめ決めた有意水準との比較です。
まとめ(試験直前用)
- z検定は「母平均の検定」
- 前提は「大標本」または「母分散既知」
- 小標本なら基本はt検定
- z値は差を標準化したもの
- 検定とp値を混同しない
DS検定では
「どの条件ならどの検定を使うか」を判断できることが最重要です。
対応スキル項目(データサイエンス力シート)
- 統計基礎
- 仮説検定
- ★ 仮説検定の基本的な考え方を理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】