gk cnn
G検定トップ
> FPN(Feature Pyramid Network)とは?G検定対策
まず結論
- FPN(Feature Pyramid Network)とは、低解像度から高解像度までの特徴マップをピラミッド構造として統合し、さまざまな大きさの物体を検出しやすくする物体検出手法です。
- G検定では「マルチスケール特徴をどう扱うか」が問われます。
直感的な説明
- FPNは「遠くの大きな物体も、近くの小さな物体も、同時に見える目」を作る仕組みです。
-
CNNでは、
- 浅い層:細かい情報(高解像度)
- 深い層:意味的に強い情報(低解像度) を持ちます。
- FPNはこれらを上下につなぎ直して活用します。
定義・仕組み
-
FPNは
- ボトムアップ経路(通常のCNN)
- トップダウン経路(高レベル特徴を上位に伝播)
- 横方向接続(同じ解像度同士を結合) から構成されます。
-
これにより、
- 高解像度かつ意味の強い特徴マップ が複数スケールで得られます。
いつ使う?(得意・不得意)
得意な場面
- 物体のサイズがばらつく検出問題
- 小物体検出
- Faster R-CNN などとの組み合わせ
不得意・注意点
- 単体では分類モデルとして使えない
- 仕組みを理解せずに名称だけ覚えると混同しやすい
G検定ひっかけポイント
-
最大のひっかけ
- 「FPNは注意機構である」→ ❌(それは SENet)
-
よくある混同
- SSD:複数スケールで検出はするが、FPN構造そのものではない
- SENet:チャネル方向の重み付け
- VGG:基本的なCNNバックボーン
-
選択肢で
- 「ピラミッド構造」「低〜高解像度」→ FPN
まとめ(試験直前用)
- FPNはマルチスケール特徴を統合
- 小さな物体検出に強い
- 注意機構や単なるCNNではない
- 「ピラミッド構造」が最重要キーワード *
🔗 関連記事
- AlexNet(ディープラーニング革命の起点)とは?G検定対策
- Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】
- Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】
- AutoAugment・RandAugment・TrivialAugmentの違い【画像データ拡張 完全比較|G検定対策】
- Brightness(明るさ調整)とは?【データ拡張|G検定対策】
🏠 G検トップに戻る