ds statistics
DS検定トップ
> 離散型確率分布と連続型確率分布の違いとは?【DS検定】
まず結論
- 離散型確率分布は「とびとびの値」を扱う分布、連続型確率分布は「なめらかな連続値」を扱う分布です。
- DS検定では「数えられるか?測るものか?」を判断できるかが問われます。
直感的な説明
サイコロを思い浮かべてください。
出る目は
1・2・3・4・5・6
と飛び飛びの値です。
これは「離散型」です。
一方、身長や気温はどうでしょうか?
170cm、170.1cm、170.01cm…
とどこまでも細かく取れる値です。
これは「連続型」です。
つまり、
- 数えるもの → 離散型
- 測るもの → 連続型
と覚えると、かなり整理できます。
定義・仕組み
■ 離散型確率分布
- 取り得る値が有限または可算無限
- それぞれの値に「確率」が直接割り当てられる
代表例:
- ベルヌーイ分布
- 二項分布
- ポアソン分布
例: 「1日に来店する客数」 → 0人、1人、2人…と数えられる
■ 連続型確率分布
- 取り得る値が連続的
- ある一点の確率は0
- 「区間の確率」で考える
代表例:
- 正規分布
- 一様分布
- 指数分布
例:
「機械の部品の長さ」
→ ちょうど10.000cmの確率は考えない
→ 9.9〜10.1cmの範囲で考える
DS検定では
「一点の確率を求める」と書かれていたら連続型では不自然
と気づけることが重要です。
どんな場面で使う?
■ 離散型を使う場面
- 件数
- 回数
- 成功/失敗
- イベントの発生回数
例:
- 不良品の個数
- メール開封回数
■ 連続型を使う場面
- 測定値
- 時間
- 距離
- 重さ
例:
- 製品の重さ
- 反応時間
- 温度
ビジネス文脈では
「KPIがカウントか測定値か」を見抜くことが大切です。
よくある誤解・混同
❌ 小数が出たら連続型?
違います。
例えば「平均値」は小数になりますが、
元データが人数なら離散型です。
❌ 0と1だけなら連続型?
0か1の二択は典型的な離散型(ベルヌーイ分布)です。
❌ 正規分布は全部のデータに使える?
正規分布は連続型専用です。
「回数」にそのまま当てはめるのは不自然です。
DS検定の典型的ひっかけ
- 「ポアソン分布」を連続型と誤認させる問題
- 「正規分布」をカウントデータに使わせる選択肢
- 「一点の確率」を連続型で求めさせる記述
選択肢では
「確率を直接足しているか?」
「面積で考えているか?」
を見ると切れます。
まとめ(試験直前用)
- 数えるもの → 離散型
- 測るもの → 連続型
- 離散型は「値ごとに確率」
- 連続型は「区間で確率」
- 正規分布は連続型、ポアソン分布は離散型
迷ったら
「それはカウントか?測定か?」
と自分に問いかける。
対応スキル項目(データサイエンス力シート)
- 数理・統計基礎力
- 確率分布
- ★ 確率分布の種類と特徴を理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】