Skip to the content.

G検定トップ > 物体検出モデル総まとめ(SSD / YOLO / R-CNN系)

まず結論

G検定の物体検出は、「段数」と「目的」の2軸で一瞬で切ります。

  • 1段階 × 速度重視 → SSD / YOLO
  • 2段階 × 精度重視 → R-CNN / Fast R-CNN / Faster R-CNN

👉 モデル名を細かく覚えるより、この対応関係を反射で出せるかが最重要です。


直感的な説明

物体検出モデルは、大きく2タイプに分かれます。

即断型(1段階)

  • 画像を見た瞬間に
  • 「位置」と「クラス」を同時に出す

👉 速いが、精度はほどほど

慎重型(2段階)

  • まず「物体がありそうな場所」を絞り
  • その後にクラス分類を行う

👉 遅いが、精度が高い


定義・仕組み(全体像)

1段階モデル(One-stage)

  • 候補領域生成を行わない
  • 位置推定とクラス分類を同時に実施

代表例:

  • SSD
  • YOLO

2段階モデル(Two-stage)

  • 第1段階:候補領域(Region Proposal)を生成
  • 第2段階:候補領域ごとに分類・位置補正

代表例:

  • R-CNN
  • Fast R-CNN
  • Faster R-CNN(RPNあり)

いつ使う?(得意・不得意)

1段階モデルが向く場面

  • リアルタイム処理
  • 動画解析・監視カメラ
  • 組み込み・エッジデバイス

2段階モデルが向く場面

  • 高精度が求められる解析
  • 小さな物体の検出
  • オフライン処理・研究用途

一発で分かる比較表(最重要)

モデル 段数 主目的 特徴キーワード
YOLO 1段階 速度 Once / グリッド
SSD 1段階 速度 Single Shot / Default Box
R-CNN 2段階 精度 候補領域 / 遅い
Fast R-CNN 2段階 精度 特徴共有 / RoI
Faster R-CNN 2段階 精度 RPN / Proposal

👉 この表をそのまま暗記してOKです。


G検定ひっかけポイント総整理

① 「Faster R-CNNは高速モデル」→ ❌

  • Fasterは「R-CNNより速い」だけ
  • SSD / YOLOよりは遅い

② 「Fast R-CNNは候補領域も内製」→ ❌

  • 候補領域は外部手法
  • 内製(RPN)するのは Faster R-CNN

③ 「Anchor / Default Box / RPN の混同」

  • Default Box:SSD(Anchorの呼び名)
  • Anchor Box:ひな形の四角
  • RPN:Faster R-CNN専用(候補領域生成)

まとめ(試験直前用)

  • まず 1段階 or 2段階 を判定
  • 次に 速度重視 or 精度重視 を判定
  • RPNが出たら Faster R-CNN
  • Single / Once が出たら SSD / YOLO

📝 最終判断:

1段階=速い、2段階=正確

これで物体検出は切れます。

🔗 関連記事


🏠 G検トップに戻る