ds visualization
まず結論
- グラフの種類とは、データの特徴に応じて適切な可視化方法を選ぶための手段です。
- DS検定では「どのグラフが何を見るためのものか」を判断できるかがよく問われます。
直感的な説明
データを分析するとき、
数字の表だけでは特徴が分かりにくいことがあります。
例えば売上データを見るときでも、
- 商品ごとの売上比較 → 棒グラフ
- 月ごとの売上の変化 → 折れ線グラフ
- 売上の構成割合 → 円グラフ
- 2つのデータの関係 → 散布図
のように、目的によってグラフを変える必要があります。
もし間違ったグラフを選ぶと、
- 比較したいのに変化が見えない
- 割合なのに関係性のグラフを使ってしまう
といった誤解が生まれます。
そのためDS検定では
「どのグラフがどんな分析目的に適しているか」
を理解しているかが問われます。
定義・仕組み
代表的なグラフの種類と目的は次のとおりです。
| グラフ | 目的 |
|---|---|
| 棒グラフ | 数量の大小を比較する |
| 積み上げ棒グラフ | 内訳の割合を比較する |
| 折れ線グラフ | 時系列の変化を見る |
| 円グラフ | 構成割合を見る |
| 散布図 | 2つのデータの関係を見る |
| バブルチャート | 3つのデータを同時に表現する |
| レーダーチャート | 複数項目の特徴を比較する |
| ヒートマップ | 数値の大小を色で表現し、分布やパターンを把握する |
ポイントは、
グラフは「何を見たいか」によって決まるということです。
例えば、
- 比較 → 棒グラフ
- 時間変化 → 折れ線
- 割合 → 円グラフ
- 関係 → 散布図
- 分布・パターン → ヒートマップ
という対応になります。
どんな場面で使う?
棒グラフ
- 商品別売上
- 部門別利益
- 国別人口
カテゴリ間の比較に向いています。
折れ線グラフ
- 月別売上
- 気温の推移
- 株価の変化
時間による変化(時系列)を見るときに使います。
円グラフ
- 売上構成比
- 市場シェア
全体に対する割合を見るときに使います。
散布図
- 広告費と売上
- 勉強時間とテスト点数
2つのデータの関係性(相関)を確認するときに使います。
バブルチャート
- GDP
- 人口
- 成長率
など、3つの変数を同時に可視化する場合に使います。
レーダーチャート
- 商品評価
- 能力比較
- スキル分析
複数の指標の特徴を比較するときに使います。
ヒートマップ
ヒートマップは、
数値の大きさを色の濃さで表現する可視化手法です。
例えば
- 曜日 × 時間帯 の売上
- 店舗 × 商品 の販売数
- Webページのクリック分布
などのデータを可視化するときに使われます。
数値をそのまま見るよりも
どこに特徴やパターンがあるかを直感的に把握できます。
また、相関行列を可視化する場合にもよく利用されます。
ただし、ヒートマップ自体は相関専用のグラフではありません。
よくある誤解・混同
棒グラフと折れ線グラフ
DS検定ではよく混同させてきます。
| グラフ | 用途 |
|---|---|
| 棒グラフ | 項目の比較 |
| 折れ線グラフ | 時系列の変化 |
時間の流れがあるデータは折れ線グラフ
と覚えておくと判断しやすくなります。
円グラフと棒グラフ
選択肢では次のような表現が出ます。
「割合を比較するグラフ」
この場合、
- 全体の構成 → 円グラフ
- 数量の比較 → 棒グラフ
となります。
散布図とヒートマップ
ここはDS検定で混同しやすいポイントです。
| グラフ | 主な目的 |
|---|---|
| 散布図 | 2つの変数の関係(相関)を見る |
| ヒートマップ | 数値の分布やパターンを見る |
選択肢で
- 「相関関係を確認する」
と書かれていた場合は
散布図が正解になるケースが多いです。
まとめ(試験直前用)
- 棒グラフ → 数量の比較
- 折れ線グラフ → 時間変化
- 円グラフ → 割合
- 散布図 → データの関係(相関)
- ヒートマップ → 数値の分布やパターン
DS検定では
分析目的に合ったグラフを選べるかが問われます。
特に
- 棒グラフ vs 折れ線
- 円グラフ vs 棒グラフ
- 散布図 vs ヒートマップ
は典型的なひっかけなので注意しましょう。
対応スキル項目(データエンジニアリング力シート)
- スキルカテゴリ名:データ共有
- サブカテゴリ名:データ連携
★ BIツールの自由検索機能を活用し、必要なデータを抽出して、グラフを作成できる
🔗 関連記事
- BIツール操作チートシート|スライス・ダイス・ドリルダウンの違い【DS検定】
- 箱ひげ図とは?四分位数と外れ値の読み取り方【DS検定】
- データキューブとは?OLAP分析の基本概念を理解する【DS検定】
- データを読む・説明する・扱うとは?データリテラシー実践ガイド【DS検定】
- テンドログラム(階層クラスタリングの樹形図)とは?【DS検定】