gk neural_network
G検定トップ
> 異常検知でAE(オートエンコーダ)を使う理由とは?【G検定頻出】
まず結論
- AE(オートエンコーダ)は「正常データだけで学習でき、再構成誤差で異常を検知できる」ため、異常検知に使われる。
- G検定では「なぜ分類器ではなくAEなのか」が問われる。
直感的な説明
AEは、
「いつも見ている正常な形」を覚えるAIです。
- 正常データ → きれいに復元できる
- 異常データ → うまく復元できない
👉 復元の失敗度合い(ズレ)を見る
これが異常検知です。
「異常そのものを覚える」のではなく、
正常だけを覚えるのがポイントです。
定義・仕組み
AEによる異常検知の基本構造は以下です。
- 正常データのみで学習
- 入力データを圧縮(エンコード)
- 元の形に復元(デコード)
- 再構成誤差(復元誤差) を計算
- 誤差が大きければ「異常」と判断
重要:
- 教師なし学習
- 異常ラベルが不要
- 判定基準は「誤差の大きさ」
いつ使う?(得意・不得意)
得意なケース
- 異常データがほとんど存在しない
- 異常の種類が未知
- 正常データは大量にある
- 設備監視・ログ監視・センサデータ
不得意・注意点
- 正常データに多様性がありすぎると精度低下
- 閾値(しきい値)設定が必要
- 異常の「種類分類」はできない
G検定ひっかけポイント
G検定では、次の誤解を狙ってきます。
よくある誤解
- ❌「異常検知は必ず教師あり学習」
- ❌「異常データを大量に集めて学習する」
- ❌「分類問題として解く」
正しい判断基準
- 異常データが少ない → AE
- 正常だけ学習 → AE
- 再構成誤差 → AE
問題文に
「異常データが少ない」「未知の異常」
とあれば AEが正解候補。
まとめ(試験直前用)
- AEは正常データだけで学習
- 異常は「復元できない」ことで検知
- 教師なし学習
- 再構成誤差が判断軸
- 異常検知=AEは超頻出
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る