ds statistics
DS検定トップ
> 標準正規分布と正規分布の違いとは?【DS検定リテラシー】
まず結論
- 正規分布は「平均を中心に左右対称に広がる山型の分布」
- 標準正規分布は「平均0・分散1にそろえた特別な正規分布」
- Zは標準化された確率変数であり、確率を求めるための共通スケール
DS検定では
👉 正規分布の性質
👉 標準化(Z変換)の意味
👉 Zを使う理由
を理解しているかが問われます。
直感的な説明
正規分布とは?
身長やテストの点数のように、
- 真ん中が多い
- 両端が少ない
という山型の分布です。
中心が「平均」です。
標準正規分布とは?
たとえば、
- 平均170cmの身長
- 平均65点のテスト
単位が違うと比較できません。
そこで、
👉 「平均との差が何個分の標準偏差か?」
に変換します。
その結果できるのが
標準正規分布(Zの世界)です。
定義・仕組み
① 正規分布の公式
正規分布は、次の式で表されます。
\[f(x)=\frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\]意味だけ押さえましょう。
- μ(ミュー)=平均
- σ(シグマ)=標準偏差
- xが平均から離れるほど確率は小さくなる
式の形は覚えなくてよいですが、
👉 平均と分散で形が決まる
ことが重要です。
② 標準正規分布
標準正規分布は
- 平均 = 0
- 分散 = 1
の正規分布です。
式の形は同じですが、μ=0、σ=1になります。
③ 確率変数Zの公式(標準化)
標準化は次の式です。
\[Z=\frac{X-\mu}{\sigma}\]意味は:
- X = 元の値
- μ = 平均
- σ = 標準偏差
- Z = 「平均から何σ離れているか」
つまり、
👉 単位を消して共通スケールに変換する操作
これがZです。
どんな場面で使う?
① 確率を求めるとき
例: 「180cm以上の人はどれくらいか?」
- Zに変換
- 標準正規分布表を見る
この流れになります。
DS検定ではこの考え方が問われます。
② 異常値の判断
-
Z > 2 → やや珍しい -
Z > 3 → かなり珍しい
品質管理や異常検知で使います。
③ 異なる指標の比較
テスト点数と売上のように
単位が違うデータでも比較できます。
よくある誤解・混同
❌ 正規分布は平均0である
→ それは標準正規分布だけ。
❌ 標準正規分布は別物
→ 正規分布の特殊ケース。
❌ Zは確率そのもの
→ Zは位置(標準化された値)。
確率はZから求める。
DS検定の典型ひっかけ
選択肢で:
- 「正規分布は平均0である」→ ×
- 「標準正規分布は任意の平均をとる」→ ×
- 「Zは確率である」→ ×
と切れるようにしておきましょう。
まとめ(試験直前用)
- 正規分布は平均μ・標準偏差σで決まる
- 標準正規分布は μ=0、σ=1
- Z = (X−μ)/σ で標準化する
- Zは確率ではなく「位置」
- DS検定では「なぜ標準化するか」を問われる
対応スキル項目(データサイエンス力シート)
- 数理・統計基礎力
- 確率・統計の基礎理解
- ★ 正規分布などの代表的な確率分布の特徴を理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】