Stable Diffusion（拡散モデルの代表例） | AI・データサイエンス・IT学習ノート

gk neural_network generative_model diffusion

G検定トップ＞ Stable Diffusion（拡散モデルの代表例）

まず結論

Stable Diffusion は Diffusion Model をベースにした画像生成モデル
テキストから画像を生成できる（Text-to-Image）
潜在空間（Latent Space）で拡散を行うため高速・軽量

👉 G検定では
「Diffusion × 潜在空間」 が最大のキーワード。

直感的な説明

Stable Diffusion は一言でいうと、

画像そのものではなく、圧縮した世界でノイズ除去を行う拡散モデル

です。

普通の Diffusion Model は、

高画質
でも重い・遅い

という弱点がありました。

Stable Diffusion では、

画像を一度 潜在表現に圧縮
潜在空間で拡散・逆拡散
最後に画像として復元

👉
軽くて実用的 になっています。

定義・仕組み

Stable Diffusion とは？

Latent Diffusion Model（LDM） の一種
Diffusion Model を 潜在空間 で実行
テキスト条件付き生成が可能

主要コンポーネント

VAE
- 画像 ↔ 潜在空間の変換
U-Net
- ノイズ除去（逆拡散）
Text Encoder（CLIP など）
- テキスト条件を理解

👉
VAE + Diffusion + Text

Diffusion Model との違い（超重要）

項目	Diffusion Model	Stable Diffusion
拡散する空間	画像空間	潜在空間
計算コスト	高い	低い
実用性	研究向け	実用向け
テキスト生成	限定的	可能

何ができる？

テキスト → 画像生成
画像 → 画像変換
インペインティング（欠損補完）
スタイル変換

G検定ひっかけポイント

❌ よくある誤解

❌ 「Stable Diffusion は GAN」
❌ 「VAEだけで画像生成」
❌ 「CNNの分類モデル」

✅ 正しい理解

ベースは Diffusion Model
潜在空間で拡散
U-Netでノイズ除去

試験での即断キーワード

「拡散モデル」 → Diffusion / Stable Diffusion
「潜在空間」 → Stable Diffusion
「Text-to-Image」 → Stable Diffusion

まとめ（試験直前用）

Stable Diffusion = Latent Diffusion
Diffusion Model の実用形
高品質かつ軽量
GANではない

👉 次は
生成モデルひっかけ問題集（GAN / VAE / Diffusion）
に進むと、ここまでが完全に固まります。

🔗 関連記事

🏠 G検トップに戻る