gk cnn
G検定トップ
> Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】
まず結論
- Atrous Convolution(拡張畳み込み)とは、畳み込みカーネルの間隔を広げることで、解像度を落とさずに広い受容野を確保する手法である。
- G検定では「セグメンテーションで空間情報を保つための工夫」として問われる。
直感的な説明
普通の畳み込みは、
- カーネルを ぎゅっと詰めて 画像を見る
イメージです。
一方、Atrous Convolutionは、
- カーネルの間に すき間(穴)をあけて 画像を見る
イメージです。
👉 その結果、
- 一度に広い範囲を見られる
- でも 画像の解像度は下げない
という、セグメンテーションにとって理想的な性質を持ちます。
定義・仕組み
定義
- 畳み込みカーネルの要素間に間隔(dilation rate)を導入する畳み込み
- 「Atrous」はフランス語で「穴のあいた」という意味
仕組みのポイント
- dilation rate = 1
→ 通常の畳み込み - dilation rate > 1
→ カーネルの間隔が広がる
重要:
- パラメータ数は増えない
- 受容野(receptive field)だけが広がる
いつ使う?(得意・不得意)
得意な場面
- 画像セグメンテーション
- 出力の解像度が重要なタスク
- DeepLab 系モデル
なぜプーリングではダメ?
- プーリングは解像度を下げる
- セグメンテーションでは位置情報が重要
- Atrous Convolutionなら 解像度を保ったまま文脈情報を取得可能
G検定ひっかけポイント
ここはかなり狙われます。
よくある誤解
- ❌「計算量削減の手法」
- ❌「MobileNet用の軽量化技術」
- ❌「フレームワーク名」
- ❌「RNNやLSTMの技術」
正しい判断基準
- 受容野を広げる → Atrous Convolution
- 解像度を保つ → Atrous Convolution
- セグメンテーション → Atrous Convolution
- 軽量化 → Depthwise Separable Convolution
問題文に
「DeepLab」「セグメンテーション」「解像度を保つ」
とあれば Atrous Convolution。
まとめ(試験直前用)
- Atrous=穴あき畳み込み
- 受容野を広げる
- 解像度は落とさない
- セグメンテーション向き
- DeepLabの中核技術
🔗 関連記事
- AlexNet(ディープラーニング革命の起点)とは?G検定対策
- Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】
- AutoAugment・RandAugment・TrivialAugmentの違い【画像データ拡張 完全比較|G検定対策】
- Brightness(明るさ調整)とは?【データ拡張|G検定対策】
- CAE(畳み込みオートエンコーダ)とは?G検定対策
🏠 G検トップに戻る