gk 機械学習 評価指標 頻出
G検定トップ
> Accuracy(正解率)
まず結論
Accuracy(正解率)は、全データのうち「正しく分類できた割合」です。
混同行列でいうと TP と TN が正解なので、
Accuracy = (TP + TN) / (TP + TN + FP + FN)
直感的な説明
- 100問中、正解が90問なら 正解率90%
- 「当たり(陽性)」でも「ハズレ(陰性)」でも、当たっていれば正解として数えます
👉 だから 一番わかりやすい指標 です。
混同行列からの式(最重要)
| 予測:陽性 | 予測:陰性 | |
|---|---|---|
| 実際:陽性 | TP | FN |
| 実際:陰性 | FP | TN |
- 正解:TP と TN
- 全体:TP + TN + FP + FN
いつ使う?(得意・不得意)
得意
- クラスの偏りが少ない(陽性/陰性が同じくらい)とき
- ざっくり全体の性能を見たいとき
苦手(ここ重要)
- クラスが偏っていると、見た目が良く見えることがある
例:99%が「正常」、1%が「異常」
全部「正常」と予測しても、Accuracy は 99% になってしまう。
👉 異常検知では Accuracyだけだと危険 なことが多いです。
G検定ひっかけポイント
- Accuracy は「正解率」で分かりやすいが、偏りデータで騙される
- 異常検知・医療診断などは
👉 Precision(誤検知) / Recall(見逃し) もセットで見る
よくある勘違い
- ❌ Accuracy が高い=良いモデル
→ ⭕ 偏りがある場合は、Precision/Recallも確認する - ❌ Accuracy は「陽性だけの正解率」
→ ⭕ 陽性も陰性も、当たったら正解
まとめ(試験直前用)
- Accuracy = (TP + TN) / 全部
- 一番わかりやすい指標
- ただし偏りデータでは 高く見えても役に立たないことがある
- 異常検知では Precision / Recall を一緒に見る
🔗 関連記事
🏠 G検トップに戻る