Skip to the content.

DS検定トップ > 対称差集合とは?意味と考え方をやさしく整理【DS検定】

まず結論

  • 対称差集合とは「どちらか一方にだけ含まれる要素の集合」です。
  • DS検定では、「和集合から共通部分を除く」という関係を正しく判断できるかが問われます。

直感的な説明

2つのグループを考えてみます。

  • P:Pythonが使える人
  • Q:SQLが使える人

対称差集合は、

「Pythonだけ使える人」と「SQLだけ使える人」

の集合です。

両方に当てはまる人は含みません。

つまり、

  • 「重なっている部分」は除く
  • 「どちらか片方だけ」を残す

というイメージです。

定義・仕組み

集合 P と集合 Q の対称差集合は、

P と Q のどちらか一方にのみ属する要素の集合

です。

式で表すと、次の形になります。

  • (P ∪ Q) − (P ∩ Q)

意味だけ押さえましょう。

  • P ∪ Q … どちらかに含まれるすべて
  • P ∩ Q … 両方に含まれる部分
  • それを引く → 重なりを取り除く

つまり、

「全部集めて、重なりだけ削る」

という操作です。

DS検定ではこの変形が選択肢で出ます。

どんな場面で使う?

① データの差分比較

  • 前回購入した人と今回購入した人の差分
  • 旧システムと新システムで一致しないレコード

「共通している部分」ではなく
「どちらかにしかない部分」を知りたいときに使います。

② データクリーニング

  • 2つのデータセットの不一致検出
  • 重複を除外したいとき

よくある誤解・混同

❌ 和集合と混同する

和集合(P ∪ Q)は「どちらか、または両方」です。

対称差集合は「どちらか片方だけ」です。

DS検定では
「または」という日本語に注意させてくる問題が多いです。

❌ 差集合と混同する

P − Q は
「Pにだけあるもの」です。

対称差は
「Pだけ」+「Qだけ」です。

片側だけではありません。

さらに重要なのはここです。

  • P − Q と Q − P は 異なる
  • しかし PΔQ と QΔP は 同じ

対称差は「どちらか一方にだけ含まれるもの」を 両側から集めた集合なので、順番を入れ替えても結果は変わりません。

一方、差集合は「片側だけ」を取るため、 順番で結果が変わります。

DS検定では
「順番で変わるか?」を判断させる選択肢が出ることがあります。

排他的論理和との関係

対称差集合は論理でいう
「排他的OR(どちらか一方)」と同じ考え方です。

選択肢で

  • 「共通部分を含む」と書いてあれば誤り
  • 「重複を除く」と書いてあれば正しい方向

と判断できます。

まとめ(試験直前用)

  • 対称差集合=「どちらか片方だけ」
  • 共通部分は含まない
  • 和集合 − 共通部分という発想
  • 「または(両方含む)」との違いに注意

DS検定では
“重なりを除く”と書いてあるかどうかが判断基準です。

対応スキル項目(データサイエンス力シート)

  • 数理・統計基礎力
  • 集合と論理の基礎理解
  • ★ 和集合、積集合、差集合、対称差集合、補集合についてベン図を用いて説明できる

🔗 関連記事


🏠 DS検定トップに戻る