Skip to the content.

DS検定トップ > マーケットバスケット分析とは?(購買パターン分析の基本)【DS検定】

まず結論

マーケットバスケット分析(Market Basket Analysis)は、「一緒に購入されやすい商品」を見つけるための分析手法です。

DS検定では

アソシエーション分析

支持度・信頼度・リフト値

Aprioriアルゴリズム

とセットで出題されることが多く、

「購買データから関連商品を見つける分析」

と理解できていれば選択肢を切ることができます。

直感的な説明

スーパーやECサイトでは、次のようなパターンがよく見られます。

ビール → おつまみ パン → 牛乳 カレー → 福神漬

このように

「一緒に買われやすい商品」

を見つけるのがマーケットバスケット分析です。

名前の由来は

買い物かご(バスケット)の中身

を分析することから来ています。

例えば

ビールを買う人は ポテトチップスも買うことが多い

という関係が分かれば

レコメンド

商品配置

セット販売

などに活用できます。

定義・仕組み

マーケットバスケット分析は

購買履歴データから商品間の関連ルールを発見する分析手法

です。

X → Y

というルールを見つけます。

意味は

Xを買った人は Yも買うことが多い

という関係です。

このルールを評価するために

次の指標を使います。

支持度(Support)

XとYが一緒に購入される割合

どれくらい頻繁に起きるかを示します。

信頼度(Confidence)

Xを買った人のうち Yも買う割合

ルールの強さを示します。

リフト値(Lift)

XとYの関係が 偶然かどうか

を判断する指標です。

リフト値

1

であれば

関連がある可能性が高い

と考えます。

どんな場面で使う?

代表的な活用例は次です。

ECサイトのレコメンド

この商品を買った人は こちらも購入しています

スーパーの商品配置

関連商品を

近くに配置する

ことで売上を増やします。

セット販売

ハンバーガー + ポテト

のようなセット商品も

マーケットバスケット分析の結果を参考に作られることがあります。

DS検定では

購買履歴 ↓ 関連ルール

という流れが理解できていればOKです。

よくある誤解・混同

誤解①

マーケットバスケット分析=予測モデル

これは誤りです。

マーケットバスケット分析は

未来を予測するモデルではなく「パターン発見」

です。

誤解②

信頼度が高い=意味のあるルール

これも誤りです。

例えば

牛乳

のように

もともとよく売れる商品は

信頼度が高くなりやすいです。

そのため

リフト値

を使って

偶然ではない関係か

を判断します。

誤解③

関連がある=因果関係

これも注意が必要です。

マーケットバスケット分析で分かるのは

一緒に買われる関係

であり

原因と結果

ではありません。

DS検定では

相関と因果の違い

と混同させる問題が出ることがあります。

まとめ(試験直前用)

マーケットバスケット分析は 購買パターン分析

一緒に購入されやすい商品を見つける

指標は 支持度・信頼度・リフト値

Aprioriアルゴリズムとセットで出題される

関係が見えるだけで 因果関係ではない

対応スキル項目(データサイエンス力シート)

データ分析基礎

データの関係性理解

★ データ間の関係性を分析する基本的な手法を理解している

🔗 関連記事


🏠 DS検定トップに戻る