ds environment-setup design
DS検定トップ
> 増分バックアップと差分バックアップの違いとは?【DS検定リテラシー】
まず結論
増分バックアップは「直前のバックアップからの差分だけ」を保存し、差分バックアップは「最初のフルバックアップからの差分」を毎回保存する方法です。
DS検定では「復元の手順」と「データ量の増え方」を判断できるかが問われます。
直感的な説明
毎日レポートを更新しているとします。
- 月曜日にフルバックアップ(全部保存)
- 火曜日に一部修正
- 水曜日にさらに修正
このとき、
増分バックアップは
「火曜は月曜との差分」「水曜は火曜との差分」を保存します。
差分バックアップは
「火曜は月曜との差分」「水曜も月曜との差分」を保存します。
つまり、
- 増分は“リレー形式”
- 差分は“毎回スタート地点に戻る形式”
というイメージです。
定義・仕組み
増分バックアップ(Incremental Backup)
- 直前のバックアップ以降に変更された部分のみを保存
- データ量は小さくなりやすい
- 復元時は「フル+すべての増分」が必要
ポイントは
「バックアップ同士が連鎖している」ことです。
1つでも欠けると復元できません。
差分バックアップ(Differential Backup)
- 最後のフルバックアップ以降の変更分を毎回保存
- 日数がたつほどデータ量は増える
- 復元時は「フル+最新の差分」だけでよい
ポイントは
「常にフルを基準にしている」ことです。
どんな場面で使う?
増分バックアップが向く場面
- 毎日の変更量が多い
- 保存容量を抑えたい
- ネットワーク負荷を下げたい
データベースのログ保存などでよく使われます。
ただし、復元に時間がかかる点は注意です。
差分バックアップが向く場面
- 復元の速さを優先したい
- 運用をシンプルにしたい
災害復旧や業務停止リスクが大きいシステムでは有効です。
よくある誤解・混同
❌「どちらも前回との差分を保存する」
これは誤りです。
増分は前回との差分ですが、
差分は“最初のフルとの差分”です。
❌「増分のほうが復元が速い」
逆です。
増分は
フル → 増分1 → 増分2 → … と順番に適用する必要があります。
DS検定では
- 「復元が簡単なのはどちらか」
- 「保存容量が小さいのはどちらか」
という形で問われることが多いです。
選択肢で
「復元時に必要なバックアップの数」に注目すると切れます。
まとめ(試験直前用)
- 増分は「直前との差分」保存量は小さいが復元は複雑
- 差分は「フルとの差分」保存量は増えるが復元は簡単
- 復元に必要なファイル数が違う
- DS検定では“保存効率か復元効率か”を判断させる
対応スキル項目(データエンジニアリング力シート)
- データ管理
- データ保全
- ★ データのバックアップおよびリカバリの基本的な仕組みを理解している
🔗 関連記事
- アクセス制御リスト(ACL)とは?ファイル権限の基本を整理【DS検定】
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アジャイル開発とは?ウォーターフォール開発との違いを整理【DS検定】
- AIOpsとMLOpsの違いを一発整理【DS検定チートシート】
- AIOpsとは?MLOpsとの違いを整理【DS検定リテラシー】