gk 画像認識 物体検出 まとめ
G検定トップ
> 物体検出モデル総まとめ(SSD / YOLO / R-CNN系)
まず結論
G検定の物体検出は、「段数」と「目的」の2軸で一瞬で切ります。
- 1段階 × 速度重視 → SSD / YOLO
- 2段階 × 精度重視 → R-CNN / Fast R-CNN / Faster R-CNN
👉 モデル名を細かく覚えるより、この対応関係を反射で出せるかが最重要です。
直感的な説明
物体検出モデルは、大きく2タイプに分かれます。
即断型(1段階)
- 画像を見た瞬間に
- 「位置」と「クラス」を同時に出す
👉 速いが、精度はほどほど
慎重型(2段階)
- まず「物体がありそうな場所」を絞り
- その後にクラス分類を行う
👉 遅いが、精度が高い
定義・仕組み(全体像)
1段階モデル(One-stage)
- 候補領域生成を行わない
- 位置推定とクラス分類を同時に実施
代表例:
- SSD
- YOLO
2段階モデル(Two-stage)
- 第1段階:候補領域(Region Proposal)を生成
- 第2段階:候補領域ごとに分類・位置補正
代表例:
- R-CNN
- Fast R-CNN
- Faster R-CNN(RPNあり)
いつ使う?(得意・不得意)
1段階モデルが向く場面
- リアルタイム処理
- 動画解析・監視カメラ
- 組み込み・エッジデバイス
2段階モデルが向く場面
- 高精度が求められる解析
- 小さな物体の検出
- オフライン処理・研究用途
一発で分かる比較表(最重要)
| モデル | 段数 | 主目的 | 特徴キーワード |
|---|---|---|---|
| YOLO | 1段階 | 速度 | Once / グリッド |
| SSD | 1段階 | 速度 | Single Shot / Default Box |
| R-CNN | 2段階 | 精度 | 候補領域 / 遅い |
| Fast R-CNN | 2段階 | 精度 | 特徴共有 / RoI |
| Faster R-CNN | 2段階 | 精度 | RPN / Proposal |
👉 この表をそのまま暗記してOKです。
G検定ひっかけポイント総整理
① 「Faster R-CNNは高速モデル」→ ❌
- Fasterは「R-CNNより速い」だけ
- SSD / YOLOよりは遅い
② 「Fast R-CNNは候補領域も内製」→ ❌
- 候補領域は外部手法
- 内製(RPN)するのは Faster R-CNN
③ 「Anchor / Default Box / RPN の混同」
- Default Box:SSD(Anchorの呼び名)
- Anchor Box:ひな形の四角
- RPN:Faster R-CNN専用(候補領域生成)
まとめ(試験直前用)
- まず 1段階 or 2段階 を判定
- 次に 速度重視 or 精度重視 を判定
- RPNが出たら Faster R-CNN
- Single / Once が出たら SSD / YOLO
📝 最終判断:
1段階=速い、2段階=正確
これで物体検出は切れます。
🔗 関連記事
🏠 G検トップに戻る