Skip to the content.

まず結論

ベイジアンフィルタリングとは、利用者が迷惑メールとして振り分けたメールの特徴を学習し、似た特徴をもつメールを迷惑メールと判定する仕組みです。

SG試験では、迷惑メール対策の選択肢として、ホワイトリスト、SPF・DKIM、RBLなどと混同させてくることがあります。

判断のポイントは、「利用者の振り分け結果から学習するか」です。

直感的な説明

ベイジアンフィルタリングは、メールソフトが少しずつ賢くなるイメージです。

たとえば、利用者があるメールを「迷惑メール」として振り分けると、システムはそのメールに含まれる言葉や特徴を学習します。

その後、似た特徴をもつメールが届いたときに、

  • この単語がよく出ている
  • このような件名が多い
  • 過去に迷惑メールとされたメールに似ている

といった情報をもとに、迷惑メールらしさを判定します。

つまり、固定された一覧表だけで判定するのではなく、学習結果を使って判定する対策です。

定義・仕組み

ベイジアンフィルタリングは、ベイズ理論の考え方を使い、メールに含まれる特徴から迷惑メールである可能性を統計的に判定する方法です。

SG試験では、数式を覚えるよりも、次の流れを押さえることが大切です。

  1. 利用者がメールを「迷惑メール」または「通常メール」に振り分ける
  2. システムが、そのメールに含まれる特徴を学習する
  3. 新しく届いたメールの特徴を確認する
  4. 学習した内容と照らし合わせて、迷惑メールかどうかを判定する

特徴として、利用者が誤判定を修正すると、その結果を学習に反映できます。

そのため、学習量が増えるほど判定精度が高まりやすい一方で、最初から完全に正しく判定できるわけではありません。

どんな場面で使う?

ベイジアンフィルタリングは、迷惑メールを自動的に分類したい場面で使われます。

特に、迷惑メールの内容が日々変化する場合に有効です。

固定の送信元リストだけでは対応しにくいメールでも、本文や件名の特徴から判定できる可能性があります。

ただし、次のような対策とは役割が違います。

対策 判断の中心
ベイジアンフィルタリング メールの特徴を学習して判定する
ホワイトリスト 許可した送信元かどうかで判定する
SPF・DKIM 送信元の正当性や改ざん有無を確認する
RBL 迷惑メール送信元として登録されたIPアドレスか確認する

選択肢では、「利用者が振り分けたメールから特徴を学習する」と書かれていれば、ベイジアンフィルタリングを考えます。

一方で、「許可リスト」「正規メールサーバ」「第三者中継」「IPアドレスの一覧」といった表現が出た場合は、別の対策である可能性が高いです。

よくある誤解・混同

ホワイトリストとの違い

ホワイトリストは、信頼できる送信元をあらかじめ登録しておき、登録されていない送信元を制限する方法です。

ベイジアンフィルタリングのように、メール本文の特徴を学習して判定する仕組みではありません。

選択肢で、「許可リストに登録」とあれば、ベイジアンフィルタリングではなくホワイトリストを疑います。

SPF・DKIMとの違い

SPFやDKIMは、メールの送信元が正しいか、メールが改ざんされていないかを確認する仕組みです。

これは、迷惑メールらしい文章かどうかを学習する対策ではありません。

選択肢で、「正規のメールサーバから送信されたかを検証する」とあれば、SPFやDKIMの話です。

RBLとの違い

RBLは、迷惑メールの発信元や中継元として知られるIPアドレスをまとめたリストを使う対策です。

ベイジアンフィルタリングは、IPアドレスの登録情報ではなく、メールの特徴を学習して判定します。

選択肢で、「迷惑メール送信元のIPアドレス一覧」とあれば、RBLを考えます。

まとめ(試験直前用)

  • ベイジアンフィルタリングは、メールの特徴を学習して迷惑メールを判定する仕組み
  • 判断基準は、利用者の振り分け結果を学習するかどうか
  • ホワイトリストは、許可した送信元かどうかで判断する
  • SPF・DKIMは、送信元の正当性や改ざん有無を確認する
  • RBLは、迷惑メール送信元のIPアドレス一覧を使う

🔗 関連記事


🏠 情報セキュリティマネジメントトップに戻る