gk cheatsheet neural_network
G検定トップ
> 異常検知手法まとめ(AE / VAE / Isolation Forest / One-Class SVM)【G検定対策】
まず結論
- G検定の異常検知は 「何を基準に異常と判断するか」 で一瞬で切り分ける。
- 再構成誤差・確率・孤立しやすさ・境界、のどれかを見ている。
直感的な説明
異常検知モデルは、見ている視点がまったく違います。
- AE:「元に戻せない」
- VAE:「起こりにくい」
- Isolation Forest:「すぐ孤立する」
- One-Class SVM:「境界の外にいる」
👉 どの“考え方”かを見抜けば正解が切れる。
定義・仕組み
AE(オートエンコーダ)
- 正常データのみで学習
- 入力を圧縮 → 復元
- 再構成誤差が大きい=異常
VAE(変分オートエンコーダ)
- 潜在変数を 確率分布 で表現
- 正常データが出やすい分布を学習
- 尤度が低い=異常
Isolation Forest
- 木構造でデータを分割
- 少ない分割で孤立する点=異常
- 距離や分布を仮定しない
One-Class SVM
- 正常データを囲む 境界 を学習
- 境界の外に出た点を異常と判断
いつ使う?(得意・不得意)
AE / VAE(深層学習系)
- 高次元データ
- センサ・画像・時系列
- 正常データが大量にある
Isolation Forest
- 特徴量ベースの表形式データ
- 軽量・高速
- 分布仮定なし
One-Class SVM
- 次元がそこまで高くない
- 境界が明確なデータ
- パラメータ調整が重要
G検定ひっかけポイント
G検定では、次の言葉で判断させにきます。
判断キーワード対応表(超重要)
| 問題文のキーワード | 正解候補 |
|---|---|
| 再構成誤差 | AE |
| 確率・分布・尤度 | VAE |
| 孤立・分割回数 | Isolation Forest |
| 境界・マージン | One-Class SVM |
| 教師なし・正常のみ | 全部あり得る |
よくある誤解
- ❌「異常検知=分類問題」
- ❌「異常データを大量に学習」
- ❌「VAEとAEは同じ」
まとめ(試験直前用)
- AE:復元できない → 異常
- VAE:起こりにくい → 異常
- Isolation Forest:すぐ孤立 → 異常
- One-Class SVM:境界の外 → 異常
- 迷ったら「何を基準に異常か」を見る
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- NISC・IPA・JPCERT/CC・CSIRTの違いまとめ【一発で切れるチートシート】
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
🏠 G検トップに戻る