ds data-structure database
DS検定トップ
> スタースキーマとは?ファクトテーブルとディメンションテーブルを理解する【DS検定】
まず結論
- スタースキーマ(Star Schema)とは、データウェアハウスで使われるデータ構造の一つです。
- 中心に ファクトテーブル(事実データ) を置き、その周囲に ディメンションテーブル(分析軸) を配置します。
DS検定では
ファクトテーブルとディメンションテーブルの違い
を理解しているかがよく問われます。
直感的な説明
例えば売上分析を考えます。
企業では
- 商品
- 地域
- 日付
などの視点から売上を分析します。
このときデータは次のように整理されます。
商品
|
地域 — 売上 — 日付 | 顧客
中央にある
売上データ
がファクトテーブルです。
周囲にある
- 商品
- 地域
- 日付
- 顧客
などは 分析の視点であり、ディメンションテーブルです。
この形が星の形に見えるため
スタースキーマ
と呼ばれます。
定義・仕組み
スタースキーマは
データウェアハウスで使われるデータモデル
です。
構成は次の2種類です。
ファクトテーブル
事実データ(数値データ)を持つテーブルです。
例
| 日付 | 商品ID | 地域ID | 売上 |
|---|---|---|---|
| 2024/01 | A | 東京 | 100 |
特徴
- 数値データ
- 集計対象
- 外部キーを持つ
ディメンションテーブル
分析の視点となる情報を持つテーブルです。
例
商品テーブル
| 商品ID | 商品名 | カテゴリ |
|---|---|---|
| A | ノートPC | 電子機器 |
地域テーブル
| 地域ID | 地域名 |
|---|---|
| 1 | 東京 |
特徴
- 分析の軸
- 属性情報を持つ
どんな場面で使う?
スタースキーマは
データウェアハウス(DWH)
で使われます。
例えば
BIツール分析
BIツールでは
- 商品別売上
- 地域別売上
- 月別売上
などを分析します。
このとき
ファクトテーブルとディメンションテーブルを使うことで
高速な分析が可能になります。
OLAP分析
OLAPでは
- スライス
- ダイス
- ドリルダウン
などの分析を行います。
これらは
ディメンションを使った分析
です。
よくある誤解・混同
ファクトテーブル vs ディメンションテーブル
| テーブル | 内容 |
|---|---|
| ファクトテーブル | 売上・数量などの数値データ |
| ディメンションテーブル | 商品・地域などの分析軸 |
DS検定では
数値データ=ファクト
と覚えると判断しやすいです。
スタースキーマ vs 正規化データベース
通常のデータベースは
データの重複を減らす(正規化)
ことを重視します。
一方、スタースキーマは
分析の高速化
を重視します。
そのため
多少データが重複していても
分析しやすい構造になっています。
まとめ(試験直前用)
- スタースキーマ=データウェアハウスのデータ構造
- 中央:ファクトテーブル(数値データ)
- 周囲:ディメンションテーブル(分析軸)
- BIツールやOLAP分析で利用される
- DS検定では
ファクト=数値データと覚えると判断しやすい
対応スキル項目(データエンジニアリング力シート)
- データ基盤
- データ管理
★ データベースやデータウェアハウスなどのデータ管理基盤の基本概念を理解している
🔗 関連記事
- SQLインジェクションとは?仕組みと対策をやさしく理解【情報セキュリティマネジメント】
- データキューブとは?OLAP分析の基本概念を理解する【DS検定】
- データレイクとは?(DWHとの違いも整理)【DS検定リテラシー】
- データマートとは?(DWHとの違いを整理)【DS検定リテラシー】
- データウェアハウス(DWH)とは?データマートとの違いを理解する【DS検定】