Atrous ConvolutionとPoolingの違いとは？【受容野と解像度の観点で整理｜G検定対策】

G検定トップ＞ Atrous ConvolutionとPoolingの違いとは？【受容野と解像度の観点で整理｜G検定対策】

まず結論

Atrous Convolutionは「解像度を保ったまま受容野を広げる」手法、
Poolingは「受容野を広げる代わりに解像度を下げる」手法である。
G検定では「解像度を落とすかどうか」で明確に切り分ける。

直感的な説明

2つとも「広い範囲を見る」ための仕組みですが、方法が違います。

Pooling 👉 画像を縮めて広く見る
Atrous Convolution 👉 画像はそのままで、間隔をあけて広く見る

たとえると、

Pooling＝地図を縮小する
Atrous＝虫眼鏡を少し離して見る

です。

定義・仕組み

Pooling

近傍の値を 代表値（最大値・平均など） にまとめる操作
代表例：Max Pooling / Average Pooling

特徴：

解像度が下がる
計算量が減る
位置情報が粗くなる

Atrous Convolution（拡張畳み込み）

畳み込みカーネルの要素間に 間隔（dilation） を入れる
受容野を広げるが、出力サイズは変わらない

特徴：

解像度を保持
位置情報を保てる
パラメータ数は増えない

いつ使う？（得意・不得意）

Poolingが向く場面

画像分類
大まかな特徴が分かればよい
計算量削減が重要な場合

Atrous Convolutionが向く場面

画像セグメンテーション
ピクセル単位の予測が必要
位置情報が重要なタスク

G検定ひっかけポイント

ここが超重要です。

よくある誤解

❌「Poolingも解像度を保てる」
❌「Atrousは軽量化手法」
❌「どちらも同じ目的」
❌「セグメンテーションにはPoolingで十分」

正しい判断基準

解像度を下げる → Pooling
解像度を保つ → Atrous Convolution
分類タスク → Pooling
セグメンテーション → Atrous Convolution

問題文に
「解像度を維持」「セグメンテーション」
とあれば Atrous Convolution。

最終比較表（これだけ見ればOK）

| 観点 | Pooling | Atrous Convolution | |—|—|—| | 目的 | 情報圧縮 | 文脈拡張 | | 解像度 | 下がる | 保持 | | 受容野 | 広がる | 広がる | | 位置情報 | 粗くなる | 保たれる | | 主用途 | 分類 | セグメンテーション |

まとめ（試験直前用）

Poolingは縮める
Atrousは縮めない
解像度が分岐点
分類かセグメンテーションかで選ぶ
DeepLabならAtrous

🔗 関連記事

🏠 G検トップに戻る