ds modeling
まず結論
マーケットバスケット分析(Market Basket Analysis)は、「一緒に購入されやすい商品」を見つけるための分析手法です。
DS検定では
アソシエーション分析
支持度・信頼度・リフト値
Aprioriアルゴリズム
とセットで出題されることが多く、
「購買データから関連商品を見つける分析」
と理解できていれば選択肢を切ることができます。
直感的な説明
スーパーやECサイトでは、次のようなパターンがよく見られます。
ビール → おつまみ パン → 牛乳 カレー → 福神漬
このように
「一緒に買われやすい商品」
を見つけるのがマーケットバスケット分析です。
名前の由来は
買い物かご(バスケット)の中身
を分析することから来ています。
例えば
ビールを買う人は ポテトチップスも買うことが多い
という関係が分かれば
レコメンド
商品配置
セット販売
などに活用できます。
定義・仕組み
マーケットバスケット分析は
購買履歴データから商品間の関連ルールを発見する分析手法
です。
例
X → Y
というルールを見つけます。
意味は
Xを買った人は Yも買うことが多い
という関係です。
このルールを評価するために
次の指標を使います。
支持度(Support)
XとYが一緒に購入される割合
どれくらい頻繁に起きるかを示します。
信頼度(Confidence)
Xを買った人のうち Yも買う割合
ルールの強さを示します。
リフト値(Lift)
XとYの関係が 偶然かどうか
を判断する指標です。
リフト値
1
であれば
関連がある可能性が高い
と考えます。
どんな場面で使う?
代表的な活用例は次です。
ECサイトのレコメンド
この商品を買った人は こちらも購入しています
スーパーの商品配置
関連商品を
近くに配置する
ことで売上を増やします。
セット販売
ハンバーガー + ポテト
のようなセット商品も
マーケットバスケット分析の結果を参考に作られることがあります。
DS検定では
購買履歴 ↓ 関連ルール
という流れが理解できていればOKです。
よくある誤解・混同
誤解①
マーケットバスケット分析=予測モデル
これは誤りです。
マーケットバスケット分析は
未来を予測するモデルではなく「パターン発見」
です。
誤解②
信頼度が高い=意味のあるルール
これも誤りです。
例えば
牛乳
のように
もともとよく売れる商品は
信頼度が高くなりやすいです。
そのため
リフト値
を使って
偶然ではない関係か
を判断します。
誤解③
関連がある=因果関係
これも注意が必要です。
マーケットバスケット分析で分かるのは
一緒に買われる関係
であり
原因と結果
ではありません。
DS検定では
相関と因果の違い
と混同させる問題が出ることがあります。
まとめ(試験直前用)
マーケットバスケット分析は 購買パターン分析
一緒に購入されやすい商品を見つける
指標は 支持度・信頼度・リフト値
Aprioriアルゴリズムとセットで出題される
関係が見えるだけで 因果関係ではない
対応スキル項目(データサイエンス力シート)
データ分析基礎
データの関係性理解
★ データ間の関係性を分析する基本的な手法を理解している
🔗 関連記事
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アノテーションとは?(AI学習データを作る重要な作業)【DS検定】
- Aprioriアルゴリズムとは?(アソシエーション分析の基本手法)【DS検定】
- アソシエーション分析とは?購買データの関係性を見つける分析【DS検定】
- 共起頻度・支持度・信頼度・リフト値の違いとは?【DS検定】