ds visualization
DS検定トップ
> データ可視化における基本的な視点とは?(差・相関・分布・変化・構成)【DS検定】
まず結論
- データ可視化では「差・相関・分布・変化・構成」という基本視点で見ることで、意味のある気づきを得られる
- DS検定では「どの視点で見るべきか」を判断させる問題が多い
直感的な説明
グラフを見たときに、なんとなく眺めているだけでは意味は出てきません。
大事なのは
👉「何を見るかの視点」を持つこと
例えば売上データなら:
- 去年と比べてどう? → 差
- 気温と関係ある? → 相関
- ばらつきは? → 分布
- 時間でどう変わる? → 変化
- どの商品が多い? → 構成
👉同じデータでも「見る視点」で得られる結論が変わる
これが「可視化の基本的な視点」です。
定義・仕組み
データ可視化では、主に以下の5つの視点でデータを解釈します。
① 差(Difference)
- 比較によって違いを見る
- 例:AとBの売上の違い
👉棒グラフなどでよく使う
② 相関(Correlation)
- 2つの変数の関係を見る
- 例:気温と売上の関係
👉散布図で確認することが多い
③ 分布(Distribution)
- データのばらつきや偏りを見る
- 例:売上の頻度分布
👉ヒストグラムや箱ひげ図
④ 変化(Change)
- 時間や順序による変化を見る
- 例:月ごとの売上推移
👉折れ線グラフが代表
⑤ 構成(Composition)
- 全体に対する割合を見る
- 例:商品別売上の割合
👉円グラフや積み上げグラフ
👉重要なのは
「目的に応じて視点を選ぶこと」
どんな場面で使う?
使うべき場面
- グラフを見て意味を読み取るとき
- 可視化手法を選ぶとき
- 分析結果を説明するとき
👉「何を伝えたいか」に応じて視点を選ぶ
使うと誤解しやすい場面
-
グラフの種類だけで判断する場合
(例:とりあえず円グラフ) -
視点を意識せずに可視化する場合
👉「何を見ているのか分からないグラフ」になる
よくある誤解・混同
❌ 「グラフ=見れば分かる」
→ 間違いです
👉視点がないと、何も読み取れない
❌ 「どのグラフでも同じ」
→ 間違いです
- 差を見るなら棒グラフ
- 変化なら折れ線グラフ
👉視点とグラフはセット
❌ 「相関があれば原因がある」
→ 間違いです
👉相関は関係であって、原因ではない
DS検定のひっかけポイント
- 「構成を見るのに折れ線グラフ」→ 不適切
- 「変化を見るのに円グラフ」→ 不適切
- 「相関なのに棒グラフ」→ 不適切
👉視点とグラフの組み合わせが正しいかを見る
まとめ(試験直前用)
- 可視化は「視点」がすべて
- 基本は「差・相関・分布・変化・構成」
- 視点によって使うグラフが決まる
- DS検定では「何を見たいのか」を問われる
- 視点とグラフがズレている選択肢は誤り
対応スキル項目(データサイエンス力シート)
- スキルカテゴリ:データ可視化
- サブカテゴリ:意味抽出
- ★ データの可視化における基本的な視点を挙げることができる(特異点、相違性、傾向性、関連性など)
🔗 関連記事
- BIツール操作チートシート|スライス・ダイス・ドリルダウンの違い【DS検定】
- 箱ひげ図とは?四分位数と外れ値の読み取り方【DS検定】
- グラフの種類と使い分け(可視化の基本)【DS検定】
- データキューブとは?OLAP分析の基本概念を理解する【DS検定】
- データを読む・説明する・扱うとは?データリテラシー実践ガイド【DS検定】