ds statistics
DS検定トップ
> ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
まず結論
ベルヌーイ試行とは「成功か失敗かの2択しかない試行」のこと、
二項分布とは「それを何回か繰り返したときに成功が何回起こるか」を表す分布です。
DS検定では、「これは二項分布で考える問題かどうか」を判断できるかが問われます。
直感的な説明
コイン投げをイメージしてください。
- 表が出る(成功)
- 裏が出る(失敗)
結果は必ずどちらかです。
これを1回やるのが「ベルヌーイ試行」。
これを10回やって「表が何回出たか?」を考えるのが「二項分布」です。
ビジネスでも同じです。
- メールを送ったら「開封された/されない」
- 広告を出したら「クリックされた/されない」
- 検査で「不良/正常」
このような「YESかNOか」の世界がベルヌーイ試行です。
定義・仕組み
■ ベルヌーイ試行
- 結果は2つだけ(成功/失敗)
- 成功する確率は一定(p)
- 各試行は互いに影響しない(独立)
成功を1、失敗を0とした確率変数を考えます。
成功確率が p のとき、 失敗確率は 1−p になります。
■ 二項分布
ベルヌーイ試行を n 回行ったとき、
成功回数 X が従う分布が「二項分布」です。
確率は次の式で表されます。
\[P(X=x) = \binom{n}{x} p^x (1-p)^{n-x}\]式の意味だけ理解しましょう。
- (\binom{n}{x}):成功がx回起こる「並び方の数」
- (p^x):成功がx回起こる確率
- ((1-p)^{n-x}):失敗が残り回起こる確率
つまり、
「成功がx回起こるパターン全部を足し合わせたもの」
が二項分布です。
DS検定では式を展開させるよりも、
「なぜこの形になるのか」が理解できているかが重要です。
どんな場面で使う?
使うべき場面
- 結果が2択
- 試行回数が固定
- 成功確率が一定
- 各試行が独立
例:
- 100人にDMを送ったときの成約人数
- 50個中の不良品数
- アンケートで「賛成」と答えた人数
使えない場面
- 成功確率が毎回変わる
- 試行回数が決まっていない
- 成功か失敗かの2択でない
ここが試験での判断ポイントです。
よくある誤解・混同
❌ 「2択なら全部二項分布」
→ 試行回数が1回なら、それはベルヌーイ分布です。
❌ 「成功確率が変わっても二項分布」
→ 成功確率が一定であることが条件です。
❌ 「ポアソン分布との混同」
DS検定ではよく
- 二項分布
- ポアソン分布
を混同させてきます。
判断基準:
- 回数が固定 → 二項分布
- 時間内に何回起きるか → ポアソン分布
選択肢で 「一定時間内の発生回数」と書いてあれば注意です。
まとめ(試験直前用)
- ベルヌーイ試行=成功/失敗の2択
- 二項分布=それをn回繰り返した成功回数
- 成功確率は一定・試行は独立が条件
- 試行回数が固定かどうかで判断する
- ポアソン分布との違いに注意
DS検定では「これは二項分布で考える問題か?」を見抜ければ勝ちです。
対応スキル項目(データサイエンス力シート)
- 数理・統計基礎力
- 確率分布の理解
- ★ 代表的な確率分布(正規分布、二項分布、ポアソン分布など)の特徴を理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】
- 相関と因果の違いを一発で整理【DS検定リテラシー】