ds statistics
DS検定トップ
> 偏差値とは?標準偏差との関係と公式をやさしく整理【DS検定】
まず結論
- 偏差値とは「平均からどれくらい離れているか」を標準偏差を使って表した指標です。
- DS検定では「標準化の考え方」と「標準偏差との関係」を理解しているかが問われます。
点数そのものではなく、集団の中での位置(相対的な立ち位置)を示すのが偏差値です。
直感的な説明
80点を取ったとしても、
- 平均75点の簡単な試験
- 平均50点の難しい試験
では意味が違います。
偏差値は、
「その点数が、集団の中でどの位置にいるか」
を示す仕組みです。
- 偏差値50 → ちょうど平均
- 60 → 平均よりかなり上
- 40 → 平均より下
DS検定では
「点数の高さ」ではなく「相対的な位置」を見ていることが理解できているかが重要です。
定義・仕組み
■ 偏差値の公式
偏差値は次の式で表されます。
\[偏差値 = 50 + 10 × \frac{(得点 − 平均)}{標準偏差}\]覚えるべきなのは式そのものではなく、意味です。
■ 式の意味を分解する
① (得点 − 平均)
→ 平均からどれだけ離れているか(偏差)
② ÷ 標準偏差
→ ばらつきの大きさで調整している
(データのスケールをそろえている)
③ ×10 + 50
→ 平均が50になるように調整している
つまり、
偏差値は「標準化した値(Zスコア)」を分かりやすく変換したもの
です。
■ Zスコアとの関係
実は偏差値の中身は「標準化」です。
Zスコアの式は:
\[Z = \frac{(得点 − 平均)}{標準偏差}\]偏差値はこのZを使って、
\[偏差値 = 50 + 10Z\]と変換したものです。
DS検定では
「標準化」と「偏差値」を混同させる問題が出やすいです。
どんな場面で使う?
使うべき場面
- 異なる試験の結果を比較するとき
- 単位が違うデータを比較するとき
- データを標準化して分析するとき
ビジネスでは、
- 地域別売上の比較
- 部門評価の比較
- KPIの標準化
などに考え方が応用されます。
使うと誤解しやすい場面
- 絶対的な優秀さを示す指標と誤解する
- 母集団が違う偏差値を単純比較する
偏差値は「その集団内での位置」を示すものです。
よくある誤解・混同
① 標準偏差との混同
DS検定では
「偏差値=標準偏差」と書かれていたら誤りです。
- 標準偏差:ばらつきの大きさ
- 偏差値:集団内での位置
役割が違います。
② 高得点=高偏差値?
必ずしも正しくありません。
- みんな高得点 → 偏差値は伸びにくい
- 難しい試験 → 少し上回るだけで偏差値は上がる
DS検定では
「相対評価」と「絶対評価」を混同させてきます。
③ 平均が高いと偏差値も高い?
誤りです。
偏差値の平均は必ず50になるよう設計されています。
「偏差値は平均値を示す指標」と書いてあれば誤りです。
まとめ(試験直前用)
- 偏差値=50 + 10 × (得点 − 平均) ÷ 標準偏差
- 標準偏差で調整している=ばらつきを考慮
- 50が基準(平均)
- 絶対評価ではなく相対評価
- Zスコアを変換したもの
DS検定では
「標準化の考え方を理解しているか」が最大の判断ポイントです。
対応スキル項目(データサイエンス力シート)
- 数理・統計基礎
- 記述統計
- ★ データの代表値やばらつきの指標を理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- 因果推論とは?相関との違いを整理【DS検定リテラシー】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】