ds statistics
まず結論
因果推論とは、「ある要因が本当に結果を生み出しているのか」を見極めるための考え方です。
DS検定では、「相関がある=因果がある」と短絡しない判断力が問われます。
直感的な説明
売上が上がったときに、
「広告を出したから売上が伸びた」と言えるでしょうか?
実はそのとき、
- 季節要因
- 景気
- 他部署のキャンペーン
など、別の要因も影響しているかもしれません。
因果推論とは、 「本当に広告の効果だったのか?」を考えるための枠組みです。
ビジネスの意思決定では、 “理由を取り違える”ことが最大のリスクになります。
定義・仕組み
因果推論とは、
ある原因(処置)が結果にどの程度影響を与えたかを推定すること
です。
ここで重要な考え方が次の3つです。
① 処置群と対照群
- 処置群:施策を受けたグループ
- 対照群:施策を受けていないグループ
この2つを比較することで、 「施策の有無による差」を測ります。
② 交絡(こうらく)因子
原因と結果の両方に影響する第三の要因です。
例:
暑い日 → アイスが売れる
暑い日 → ビールも売れる
アイスとビールは相関があっても、 直接の因果関係とは限りません。
③ ランダム化比較試験(RCT)
処置群と対照群をランダムに割り当てる方法です。
ランダムに割り当てることで、 交絡因子の影響が両群に平均的に分散されます。
これにより、 「処置の効果だけ」を比較しやすくなります。
DS検定では、このランダム化の意味を理解しているかが重要です。
どんな場面で使う?
使う場面
- マーケティング施策の効果測定
- 医療や政策の効果検証
- A/Bテスト
注意が必要な場面
- 単純な前後比較(施策前 vs 施策後)
- 観測データのみでの判断
「売上が上がった=施策が成功した」と結論づけるのは危険です。
DS検定では、 「外部環境の変化を排除できているか?」が判断基準になります。
よくある誤解・混同
❌ 相関がある=因果がある
→ 必ずしも成り立たない
❌ 前後比較をすれば因果が分かる
→ 他の要因を排除できない
❌ 対照群は不要
→ 効果を正しく測れない
DS検定では、
「ランダム化」「対照群」「交絡因子」
この3つを理解していない選択肢が誤りになります。
特に、 「観測データから因果関係を直接証明できる」といった表現は要注意です。
まとめ(試験直前用)
- 因果推論は「本当にそれが原因か」を考える枠組み
- 相関と因果は別物
- 処置群と対照群の比較が基本
- ランダム化は交絡を平均化するための仕組み
- 前後比較だけでは因果は確定できない
DS検定では
「外部要因を排除できているか?」を常に確認する。
対応スキル項目(データサイエンス力シート)
- 統計的思考
- 因果関係の理解
- ★ 相関関係と因果関係の違いを理解している
🔗 関連記事
- ベイズの定理とは?(条件付き確率の逆算)【DS検定リテラシー】
- ベルヌーイ試行と二項分布とは?【DS検定リテラシー】
- 二項分布とベルヌーイ試行とは?(成功回数の確率の考え方)【DS検定】
- カイ二乗分布とは?(χ²分布の使いどころを整理)【DS検定】
- 相関と因果の違いを一発で整理【DS検定リテラシー】