Skip to the content.

DS検定トップ > スタースキーマとは?ファクトテーブルとディメンションテーブルを理解する【DS検定】

まず結論

  • スタースキーマ(Star Schema)とは、データウェアハウスで使われるデータ構造の一つです。
  • 中心に ファクトテーブル(事実データ) を置き、その周囲に ディメンションテーブル(分析軸) を配置します。

DS検定では

ファクトテーブルとディメンションテーブルの違い

を理解しているかがよく問われます。

直感的な説明

例えば売上分析を考えます。

企業では

  • 商品
  • 地域
  • 日付

などの視点から売上を分析します。

このときデータは次のように整理されます。

商品
     |
地域 — 売上 — 日付 | 顧客

中央にある

売上データ

がファクトテーブルです。

周囲にある

  • 商品
  • 地域
  • 日付
  • 顧客

などは 分析の視点であり、ディメンションテーブルです。

この形が星の形に見えるため

スタースキーマ

と呼ばれます。

定義・仕組み

スタースキーマは

データウェアハウスで使われるデータモデル

です。

構成は次の2種類です。

ファクトテーブル

事実データ(数値データ)を持つテーブルです。

日付 商品ID 地域ID 売上
2024/01 A 東京 100

特徴

  • 数値データ
  • 集計対象
  • 外部キーを持つ

ディメンションテーブル

分析の視点となる情報を持つテーブルです。

商品テーブル

商品ID 商品名 カテゴリ
A ノートPC 電子機器

地域テーブル

地域ID 地域名
1 東京

特徴

  • 分析の軸
  • 属性情報を持つ

どんな場面で使う?

スタースキーマは

データウェアハウス(DWH)

で使われます。

例えば

BIツール分析

BIツールでは

  • 商品別売上
  • 地域別売上
  • 月別売上

などを分析します。

このとき

ファクトテーブルとディメンションテーブルを使うことで

高速な分析が可能になります。

OLAP分析

OLAPでは

  • スライス
  • ダイス
  • ドリルダウン

などの分析を行います。

これらは

ディメンションを使った分析

です。

よくある誤解・混同

ファクトテーブル vs ディメンションテーブル

テーブル 内容
ファクトテーブル 売上・数量などの数値データ
ディメンションテーブル 商品・地域などの分析軸

DS検定では

数値データ=ファクト

と覚えると判断しやすいです。

スタースキーマ vs 正規化データベース

通常のデータベースは

データの重複を減らす(正規化)

ことを重視します。

一方、スタースキーマは

分析の高速化

を重視します。

そのため

多少データが重複していても
分析しやすい構造になっています。

まとめ(試験直前用)

  • スタースキーマ=データウェアハウスのデータ構造
  • 中央:ファクトテーブル(数値データ)
  • 周囲:ディメンションテーブル(分析軸)
  • BIツールやOLAP分析で利用される
  • DS検定では
    ファクト=数値データと覚えると判断しやすい

対応スキル項目(データエンジニアリング力シート)

  • データ基盤
  • データ管理

★ データベースやデータウェアハウスなどのデータ管理基盤の基本概念を理解している

🔗 関連記事


🏠 DS検定トップに戻る