Skip to the content.

G検定トップ > Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】

まず結論

  • Atrous Convolutionは「解像度を保ったまま受容野を広げる」手法
    Poolingは「受容野を広げる代わりに解像度を下げる」手法である。
  • G検定では「解像度を落とすかどうか」で明確に切り分ける。

直感的な説明

2つとも「広い範囲を見る」ための仕組みですが、方法が違います。

  • Pooling 👉 画像を縮めて広く見る
  • Atrous Convolution 👉 画像はそのままで、間隔をあけて広く見る

たとえると、

  • Pooling=地図を縮小する
  • Atrous=虫眼鏡を少し離して見る

です。

定義・仕組み

Pooling

  • 近傍の値を 代表値(最大値・平均など) にまとめる操作
  • 代表例:Max Pooling / Average Pooling

特徴:

  • 解像度が下がる
  • 計算量が減る
  • 位置情報が粗くなる

Atrous Convolution(拡張畳み込み)

  • 畳み込みカーネルの要素間に 間隔(dilation) を入れる
  • 受容野を広げるが、出力サイズは変わらない

特徴:

  • 解像度を保持
  • 位置情報を保てる
  • パラメータ数は増えない

いつ使う?(得意・不得意)

Poolingが向く場面

  • 画像分類
  • 大まかな特徴が分かればよい
  • 計算量削減が重要な場合

Atrous Convolutionが向く場面

  • 画像セグメンテーション
  • ピクセル単位の予測が必要
  • 位置情報が重要なタスク

G検定ひっかけポイント

ここが超重要です。

よくある誤解

  • ❌「Poolingも解像度を保てる」
  • ❌「Atrousは軽量化手法」
  • ❌「どちらも同じ目的」
  • ❌「セグメンテーションにはPoolingで十分」

正しい判断基準

  • 解像度を下げる → Pooling
  • 解像度を保つ → Atrous Convolution
  • 分類タスク → Pooling
  • セグメンテーション → Atrous Convolution

問題文に
「解像度を維持」「セグメンテーション」
とあれば Atrous Convolution

最終比較表(これだけ見ればOK)

| 観点 | Pooling | Atrous Convolution | |—|—|—| | 目的 | 情報圧縮 | 文脈拡張 | | 解像度 | 下がる | 保持 | | 受容野 | 広がる | 広がる | | 位置情報 | 粗くなる | 保たれる | | 主用途 | 分類 | セグメンテーション |

まとめ(試験直前用)

  • Poolingは縮める
  • Atrousは縮めない
  • 解像度が分岐点
  • 分類かセグメンテーションかで選ぶ
  • DeepLabならAtrous

🔗 関連記事


🏠 G検トップに戻る