Skip to the content.

DS検定トップ > 離散型確率分布と連続型確率分布の違いとは?【DS検定】

まず結論

  • 離散型確率分布は「とびとびの値」を扱う分布、連続型確率分布は「なめらかな連続値」を扱う分布です。
  • DS検定では「数えられるか?測るものか?」を判断できるかが問われます。

直感的な説明

サイコロを思い浮かべてください。

出る目は
1・2・3・4・5・6
飛び飛びの値です。

これは「離散型」です。

一方、身長や気温はどうでしょうか?

170cm、170.1cm、170.01cm…
どこまでも細かく取れる値です。

これは「連続型」です。

つまり、

  • 数えるもの → 離散型
  • 測るもの → 連続型

と覚えると、かなり整理できます。

定義・仕組み

■ 離散型確率分布

  • 取り得る値が有限または可算無限
  • それぞれの値に「確率」が直接割り当てられる

代表例:

  • ベルヌーイ分布
  • 二項分布
  • ポアソン分布

例: 「1日に来店する客数」 → 0人、1人、2人…と数えられる

■ 連続型確率分布

  • 取り得る値が連続的
  • ある一点の確率は0
  • 「区間の確率」で考える

代表例:

  • 正規分布
  • 一様分布
  • 指数分布

例: 「機械の部品の長さ」 → ちょうど10.000cmの確率は考えない
→ 9.9〜10.1cmの範囲で考える

DS検定では
「一点の確率を求める」と書かれていたら連続型では不自然
と気づけることが重要です。

どんな場面で使う?

■ 離散型を使う場面

  • 件数
  • 回数
  • 成功/失敗
  • イベントの発生回数

例:

  • 不良品の個数
  • メール開封回数

■ 連続型を使う場面

  • 測定値
  • 時間
  • 距離
  • 重さ

例:

  • 製品の重さ
  • 反応時間
  • 温度

ビジネス文脈では
「KPIがカウントか測定値か」を見抜くことが大切です。

よくある誤解・混同

❌ 小数が出たら連続型?

違います。

例えば「平均値」は小数になりますが、
元データが人数なら離散型です。

❌ 0と1だけなら連続型?

0か1の二択は典型的な離散型(ベルヌーイ分布)です。

❌ 正規分布は全部のデータに使える?

正規分布は連続型専用です。
「回数」にそのまま当てはめるのは不自然です。

DS検定の典型的ひっかけ

  • 「ポアソン分布」を連続型と誤認させる問題
  • 「正規分布」をカウントデータに使わせる選択肢
  • 「一点の確率」を連続型で求めさせる記述

選択肢では
「確率を直接足しているか?」
「面積で考えているか?」
を見ると切れます。

まとめ(試験直前用)

  • 数えるもの → 離散型
  • 測るもの → 連続型
  • 離散型は「値ごとに確率」
  • 連続型は「区間で確率」
  • 正規分布は連続型、ポアソン分布は離散型

迷ったら
「それはカウントか?測定か?」
と自分に問いかける。

対応スキル項目(データサイエンス力シート)

  • 数理・統計基礎力
  • 確率分布
  • ★ 確率分布の種類と特徴を理解している

🔗 関連記事


🏠 DS検定トップに戻る