Skip to the content.

DS検定トップ > データを読む・説明する・扱うとは?データリテラシー実践ガイド【DS検定】

データリテラシーとは?

(数理・データサイエンス・AI リテラシーレベル モデルカリキュラム対応)

まず結論

データリテラシーとは、

データを正しく読み、正しく説明し、正しく扱える力のことです。

DS検定では、

  • 数字にだまされない
  • 適切な比較ができる
  • グラフを正しく読み解ける

といった「基礎的判断力」が問われます。

直感的な説明

データリテラシーは、

データ社会の読み書き能力です。

  • グラフを見て違和感に気づく
  • 平均値だけで判断しない
  • 相関と因果を混同しない
  • 比較条件が揃っているか確認する

これができる状態を指します。

定義・仕組み(スキルセット完全整理)

学修目標

  • データの特徴を読み解き、起きている事象の背景や意味合いを理解できる
  • データを読み解く上で、ドメイン知識が重要であることを理解する
  • データの発生現場を確認することの重要性を理解する
  • データの比較対象を正しく設定し、数字を比べることができる
  • 適切な可視化手法を選択し、他者にデータを説明できる
  • 不適切に作成されたグラフ・数字に騙されない
  • 文献や現象を読み解き、それらの関係を分析・考察し表現できる
  • スプレッドシート等を使って、小規模データ(数百件〜数千件レベル)を集計・加工できる

2-1. データを読む

データの種類

  • 量的変数
  • 質的変数

分布と代表値

  • ヒストグラム
  • 平均値
  • 中央値
  • 最頻値

代表値の性質の違い
(実社会では平均値=最頻値でないことが多い)

ばらつき

  • 分散
  • 標準偏差
  • 最急値

観測誤差

  • 観測データに含まれる誤差の扱い

必要なデータの見極め

  • 打ち切りや脱落を含むデータ
  • 層別の必要なデータ

相関と因果

  • 相関係数
  • 疑似相関
  • 交絡

母集団と標本抽出

  • 国勢調査
  • アンケート調査
  • 全数調査
  • 単純無作為抽出
  • 層別抽出
  • 多段抽出

クロス集計・分割表

  • クロス集計表
  • 分割表
  • 相関係数行列
  • 散布図行列

統計情報の正しい理解

  • 誇張表現に惑わされない

2-2. データを説明する

データ表現

  • 棒グラフ
  • 折線グラフ
  • 散布図
  • ヒートマップ

チャート化

  • データの図表表現

比較の方法

  • 条件をそろえた比較
  • 処理の前後比較
  • A/Bテスト

不適切なグラフ

  • チャートジャンク
  • 不必要な視覚的要素

優れた可視化事例

  • 可視化により新しい気づきが得られた事例

2-3. データを扱う

  • データの集計(和、平均)
  • データの並び替え、ランキング
  • データ解析ツール(スプレッドシート)
  • 表形式データ(CSV)

どんな場面で問われる?

DS検定では、

  • 相関と因果の違い
  • 平均値と中央値の使い分け
  • 不適切なグラフの見抜き
  • 抽出方法の違い
  • A/Bテストの考え方

が頻出です。

よくある誤解

❌ 平均値が代表値として常に適切
→ 外れ値の影響を受ける

❌ 相関があれば因果がある
→ 疑似相関の可能性

❌ グラフは見やすければ良い
→ 比較軸やスケールが重要

❌ データが多ければ正しい
→ 抽出方法が重要

まとめ(試験直前用)

データリテラシーの本質は:

  • データの種類と分布を理解する
  • 比較条件を正しく設定する
  • 可視化を正しく使う
  • 数字に騙されない

DS検定では、

「正しい判断ができるか」

が中心に問われます。

🔗 関連記事


🏠 DS検定トップに戻る