ds data-storage environment-setup design
DS検定トップ
> Hot・Cool・Archiveの違いとは?(クラウドストレージ階層の整理)【DS検定】
まず結論
Hot・Cool・Archiveとは「データのアクセス頻度に応じてコストと性能を変えるクラウドストレージの階層」のことです。
DS検定では「どの用途にどの階層を選ぶか」を判断できるかが問われます。
直感的な説明
イメージは「倉庫の置き場所」です。
- Hot:手元の棚(すぐ取り出す)
- Cool:倉庫の奥(たまに使う)
- Archive:外部保管庫(ほぼ使わない)
すぐ使うデータをわざわざ遠くに置くと業務が止まります。
逆に、10年保存するログを手元に置いておくのはコストの無駄です。
クラウドでは「アクセス頻度」に応じて料金体系が変わります。
DS検定ではこの“考え方”を理解しているかが重要です。
定義・仕組み
クラウドストレージは、アクセス頻度によって階層を分けています。
Hot
- 頻繁にアクセスするデータ
- 保存コストは高め
- 取り出しは即時
Cool(または Coldline / Nearline)
- たまにアクセスするデータ
- 保存コストはやや安い
- 取り出しは可能だが、料金が発生することがある
Archive(Glacierなど)
- ほとんどアクセスしない長期保存データ
- 保存コストは最安
- 取り出しに時間がかかる/追加コストがある
- 最低保存期間が設定されていることが多い
重要なのは、 「保存コスト」と「取り出しコスト・時間」はトレードオフになっているという点です。
どんな場面で使う?
Hotを使う場面
- Webアプリの画像
- 分析中のデータ
- 日次レポート用データ
Coolを使う場面
- 月次レポート履歴
- 半年〜1年前の分析データ
Archiveを使う場面
- 監査ログ
- 法令対応の長期保存データ
- 過去バックアップ
DS検定では
「頻繁にアクセスしない」「低コストで保存」
と書かれていたら、Archiveを疑います。
よくある誤解・混同
❌ 誤解1:Archiveは遅いから使えない
→ 目的が「保存」なら問題ありません。
❌ 誤解2:どのクラウドでも名前が同じ
→ AWS・GCP・Azureで名称が異なります。
| クラウド | アーカイブ層 |
|---|---|
| AWS | S3 Glacier |
| GCP | Archive |
| Azure | Blob Archive |
DS検定では
「Persistent Disk」などを混ぜてくることがありますが、
それは仮想マシン用ディスクであり、アーカイブ用途ではありません。
まとめ(試験直前用)
- Hot=頻繁に使う
- Cool=たまに使う
- Archive=ほぼ使わない
- 保存コストと取り出し性能はトレードオフ
- 「低コスト」「長期保存」「頻繁にアクセスしない」がキーワードならArchive
“アクセス頻度で選ぶ”
これを思い出せれば選択肢は切れます。
対応スキル項目(ビジネス力シート)
- データ利活用
- データ活用環境理解
- ★ データの保存・管理方法の特徴を理解している
- ★ クラウドサービスの基本的な仕組みを理解している
🔗 関連記事
- アクセス制御リスト(ACL)とは?ファイル権限の基本を整理【DS検定】
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アジャイル開発とは?ウォーターフォール開発との違いを整理【DS検定】
- AIOpsとMLOpsの違いを一発整理【DS検定チートシート】
- AIOpsとは?MLOpsとの違いを整理【DS検定リテラシー】