ds set-theory design
DS検定トップ
> 対称差集合とは?意味と考え方をやさしく整理【DS検定】
まず結論
- 対称差集合とは「どちらか一方にだけ含まれる要素の集合」です。
- DS検定では、「和集合から共通部分を除く」という関係を正しく判断できるかが問われます。
直感的な説明
2つのグループを考えてみます。
- P:Pythonが使える人
- Q:SQLが使える人
対称差集合は、
「Pythonだけ使える人」と「SQLだけ使える人」
の集合です。
両方に当てはまる人は含みません。
つまり、
- 「重なっている部分」は除く
- 「どちらか片方だけ」を残す
というイメージです。
定義・仕組み
集合 P と集合 Q の対称差集合は、
P と Q のどちらか一方にのみ属する要素の集合
です。
式で表すと、次の形になります。
- (P ∪ Q) − (P ∩ Q)
意味だけ押さえましょう。
- P ∪ Q … どちらかに含まれるすべて
- P ∩ Q … 両方に含まれる部分
- それを引く → 重なりを取り除く
つまり、
「全部集めて、重なりだけ削る」
という操作です。
DS検定ではこの変形が選択肢で出ます。
どんな場面で使う?
① データの差分比較
- 前回購入した人と今回購入した人の差分
- 旧システムと新システムで一致しないレコード
「共通している部分」ではなく
「どちらかにしかない部分」を知りたいときに使います。
② データクリーニング
- 2つのデータセットの不一致検出
- 重複を除外したいとき
よくある誤解・混同
❌ 和集合と混同する
和集合(P ∪ Q)は「どちらか、または両方」です。
対称差集合は「どちらか片方だけ」です。
DS検定では
「または」という日本語に注意させてくる問題が多いです。
❌ 差集合と混同する
P − Q は
「Pにだけあるもの」です。
対称差は
「Pだけ」+「Qだけ」です。
片側だけではありません。
さらに重要なのはここです。
- P − Q と Q − P は 異なる
- しかし PΔQ と QΔP は 同じ
対称差は「どちらか一方にだけ含まれるもの」を 両側から集めた集合なので、順番を入れ替えても結果は変わりません。
一方、差集合は「片側だけ」を取るため、 順番で結果が変わります。
DS検定では
「順番で変わるか?」を判断させる選択肢が出ることがあります。
排他的論理和との関係
対称差集合は論理でいう
「排他的OR(どちらか一方)」と同じ考え方です。
選択肢で
- 「共通部分を含む」と書いてあれば誤り
- 「重複を除く」と書いてあれば正しい方向
と判断できます。
まとめ(試験直前用)
- 対称差集合=「どちらか片方だけ」
- 共通部分は含まない
- 和集合 − 共通部分という発想
- 「または(両方含む)」との違いに注意
DS検定では
“重なりを除く”と書いてあるかどうかが判断基準です。
対応スキル項目(データサイエンス力シート)
- 数理・統計基礎力
- 集合と論理の基礎理解
- ★ 和集合、積集合、差集合、対称差集合、補集合についてベン図を用いて説明できる
🔗 関連記事
- アクセス制御リスト(ACL)とは?ファイル権限の基本を整理【DS検定】
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アジャイル開発とは?ウォーターフォール開発との違いを整理【DS検定】
- 分析アプローチ設計とは?(分析プロジェクトを成功させる設計プロセス)【DS検定】
- 必要なデータ・分析手法・可視化を適切に選択する力とは?【DS検定】