Skip to the content.

G検定トップ > Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】

まず結論

  • Atrous Convolution(拡張畳み込み)とは、畳み込みカーネルの間隔を広げることで、解像度を落とさずに広い受容野を確保する手法である。
  • G検定では「セグメンテーションで空間情報を保つための工夫」として問われる。

直感的な説明

普通の畳み込みは、

  • カーネルを ぎゅっと詰めて 画像を見る

イメージです。

一方、Atrous Convolutionは、

  • カーネルの間に すき間(穴)をあけて 画像を見る

イメージです。

👉 その結果、

  • 一度に広い範囲を見られる
  • でも 画像の解像度は下げない

という、セグメンテーションにとって理想的な性質を持ちます。

定義・仕組み

定義

  • 畳み込みカーネルの要素間に間隔(dilation rate)を導入する畳み込み
  • 「Atrous」はフランス語で「穴のあいた」という意味

仕組みのポイント

  • dilation rate = 1
    → 通常の畳み込み
  • dilation rate > 1
    → カーネルの間隔が広がる

重要:

  • パラメータ数は増えない
  • 受容野(receptive field)だけが広がる

いつ使う?(得意・不得意)

得意な場面

  • 画像セグメンテーション
  • 出力の解像度が重要なタスク
  • DeepLab 系モデル

なぜプーリングではダメ?

  • プーリングは解像度を下げる
  • セグメンテーションでは位置情報が重要
  • Atrous Convolutionなら 解像度を保ったまま文脈情報を取得可能

G検定ひっかけポイント

ここはかなり狙われます。

よくある誤解

  • ❌「計算量削減の手法」
  • ❌「MobileNet用の軽量化技術」
  • ❌「フレームワーク名」
  • ❌「RNNやLSTMの技術」

正しい判断基準

  • 受容野を広げる → Atrous Convolution
  • 解像度を保つ → Atrous Convolution
  • セグメンテーション → Atrous Convolution
  • 軽量化 → Depthwise Separable Convolution

問題文に
「DeepLab」「セグメンテーション」「解像度を保つ」
とあれば Atrous Convolution

まとめ(試験直前用)

  • Atrous=穴あき畳み込み
  • 受容野を広げる
  • 解像度は落とさない
  • セグメンテーション向き
  • DeepLabの中核技術

🔗 関連記事


🏠 G検トップに戻る