Dilated Convolution（空洞畳み込み） | AI・データサイエンス・IT学習ノート

Dilated Convolution（空洞畳み込み）は重要ポイントを整理して理解するための用語です。この記事では仕組み・役割・使いどころを押さえ、G検定で問われる判断ポイントとひっかけポイントを解説します。

gk neural_network cnn

G検定トップ＞ Dilated Convolution（空洞畳み込み）

まず結論

Dilated Convolution は受容野を広げられる畳み込み
プーリングを使わずに特徴マップの解像度を保てる
画像サイズを小さくしないことが最大のメリット

直感的な説明

Dilated Convolution は、

カーネルの間隔をあけて畳み込む手法

です。

通常の畳み込みは、
ピクセルを「隣同士」で見ますが、
Dilated Convolution は

1つ飛ばし
2つ飛ばし

のように 間隔をあけて見る イメージです。

定義・仕組み

通常の畳み込みとの違い

通常の畳み込み
→ 連続したピクセルを処理
Dilated Convolution
→ 間隔（dilation rate）をあけて処理

これにより、

パラメータ数を増やさず
広い範囲（大域的情報）を捉えられる

という特徴があります。

重要なポイント

ストライドは変えない
プーリングを使わない
→ その結果
画像サイズ（解像度）が保たれる

いつ使う？（得意・不得意）

得意なこと

セマンティックセグメンテーション
画像の文脈（広い範囲）理解
境界情報を保ちたいタスク

（例：道路・建物・人物領域の判定）

注意点・不得意

学習が速くなるわけではない
局所的な細かい特徴だけを見る用途には不向き

G検定ひっかけポイント

ここが超重要です👇

❌ よくある誤解

❌ 「学習速度が向上する」
❌ 「より局所的な情報を扱える」

👉 どちらも誤り

✅ 正しい理解

✅ 受容野が広がる（大域的情報）
✅ 画像サイズを小さくしない
✅ プーリングの代替として使われることが多い

試験での即切りフレーズ

「サイズを保つ」
「プーリングなしで広い範囲」

👉 Dilated Convolution

他の手法との違い（整理）

手法	サイズ	見る範囲
通常Conv	変わらない	局所
Pooling	小さくなる	広がるが粗い
Dilated Conv	変わらない	広い

まとめ（試験直前用）

Dilated Convolution = 間隔をあけた畳み込み
目的は 受容野拡大
画像サイズを小さくしない
学習速度UPではない

👉 次は
Atrous Spatial Pyramid Pooling（ASPP）
との関係がよく問われます。

🔗 関連記事

🏠 G検トップに戻る