Skip to the content.

G検定トップ > CRISP-DM

まず結論

  • CRISP-DMはデータ分析プロジェクトの標準的な進め方(プロセスモデル)
  • 全部で 6つのフェーズ から構成される
  • 「契約」や法務プロセスは含まれない

直感的な説明

CRISP-DMは、

「データ分析の仕事を、どういう順番で進めるか」

を整理した 作業手順書のようなもの です。

モデルやアルゴリズムの話ではなく、

  • 何を目的にするか
  • データをどう扱うか
  • 結果をどう使うか

という プロジェクト全体の流れ を定義しています。


定義・仕組み

CRISP-DMとは?

CRISP-DM(Cross-Industry Standard Process for Data Mining) は、
業界を問わず使える データマイニング/データ分析の標準プロセスモデル です。


6つのフェーズ

CRISP-DMは次の 6段階 で構成されます。

  1. ビジネス理解
  2. データ理解
  3. データ準備
  4. モデル作成
  5. 評価
  6. 展開(デプロイ)

👉 この並びは G検定の頻出暗記事項 です。


各フェーズの簡単な意味

① ビジネス理解

  • 何を解決したいのか?
  • 成功条件は何か?

② データ理解

  • どんなデータがあるか把握
  • 欠損や偏りの確認

③ データ準備

  • 前処理・加工・特徴量作成

④ モデル作成

  • 機械学習モデルを構築

⑤ 評価

  • ビジネス目的に合っているか確認

⑥ 展開

  • 実運用への組み込み

いつ使う?(得意・不得意)

得意な場面

  • データ分析プロジェクト全般
  • 機械学習導入の進め方整理
  • チームでの共通理解づくり

注意点

  • 法務・契約・知財管理は対象外
  • 技術詳細(アルゴリズム)は定義しない

G検定ひっかけポイント

  • 「CRISP-DMに契約フェーズがある」 → 誤り
  • 「モデル作成が最初」 → 誤り
  • ビジネス理解から始まる
  • 最後は展開(Deployment)

👉
「契約・法務・ガバナンス」系ワードが出たら、CRISP-DMではない と疑う。


まとめ(試験直前用)

  • CRISP-DMは データ分析の進め方
  • フェーズは 6つ
  • 契約は含まれない
  • 展開(Deployment)が最終段階

🔗 関連記事


🏠 G検トップに戻る