ds data-understanding design
DS検定トップ
> 一次情報と二次情報の違いとは?境界を整理【DS検定】
まず結論
一次情報とは「自分たちが直接生成・取得したオリジナルデータ」、二次情報とは「他者が生成・加工した既存データ」です。
DS検定では取得方法ではなく“データの発生源”で判断できるかが問われます。
直感的な説明
同じ「データ取得」でも本質が違います。
- 店舗で自分たちが実施したアンケート → 一次情報
- 政府統計をダウンロード → 二次情報
Webスクレイピングで取得していても、
元データを作ったのが他者なら二次情報です。
ポイントは
「誰がそのデータを最初に作ったか?」
ここで判断します。
定義・仕組み
一次情報(Primary Data)
- 自分たちが直接収集
- 未加工のオリジナルデータ
- 現場・実験・観察・調査などから取得
例:
- 自社アンケート
- インタビュー
- センサー計測
- 自社ログデータ
二次情報(Secondary Data)
- 他者が生成・加工した情報
- 既存レポート・統計・公開データ
例:
- 政府統計
- 調査会社のレポート
- 新聞記事
- 他社サイトの価格情報
スクレイピングの扱い
取得方法は関係ありません。
- 政府統計をスクレイピング → 二次情報
- 他社ECサイト価格を取得 → 二次情報
- 自社サイトのアクセスログ取得 → 一次情報
DS検定ではここを混同させてきます。
どんな場面で使う?
一次情報を使う場面
- 原因特定
- 仮説検証
- 現場改善
- 新規施策の評価
二次情報を使う場面
- 市場全体の把握
- トレンド分析
- 比較調査
- 外部環境分析
ビジネスでは両方を組み合わせるのが基本です。
よくある誤解・混同
① 「スクレイピング=一次情報」
誤りです。
選択肢で
「Webから取得したデータ」と書かれていたら要注意。
発生源が他者なら二次情報です。
② 「一次情報は常に優れている」
必ずしもそうではありません。
コストや時間がかかるため、
目的に応じて使い分けます。
③ 「取得したら一次情報になる」
取得方法ではなく
生成主体で判断するのが正解です。
まとめ(試験直前用)
- 判断基準は「誰が生成したか」
- 取得方法では決まらない
- スクレイピングは基本的に二次情報
- 自社で直接収集したものが一次情報
迷ったら
発生源を見る。
対応スキル項目(ビジネス力シート)
- 課題設定力
- データ収集・整理
- ★ 課題解決のために必要な情報を特定し、適切な方法で収集できる
🔗 関連記事
- アクセス制御リスト(ACL)とは?ファイル権限の基本を整理【DS検定】
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アジャイル開発とは?ウォーターフォール開発との違いを整理【DS検定】
- 分析アプローチ設計とは?(分析プロジェクトを成功させる設計プロセス)【DS検定】
- 必要なデータ・分析手法・可視化を適切に選択する力とは?【DS検定】