物体検出モデル総まとめ（SSD / YOLO / R-CNN系） | AI・データサイエンス・IT学習ノート

gk 画像認識物体検出まとめ

G検定トップ＞物体検出モデル総まとめ（SSD / YOLO / R-CNN系）

まず結論

G検定の物体検出は、「段数」と「目的」の2軸で一瞬で切ります。

1段階 × 速度重視 → SSD / YOLO
2段階 × 精度重視 → R-CNN / Fast R-CNN / Faster R-CNN

👉 モデル名を細かく覚えるより、この対応関係を反射で出せるかが最重要です。

直感的な説明

物体検出モデルは、大きく2タイプに分かれます。

即断型（1段階）

画像を見た瞬間に
「位置」と「クラス」を同時に出す

👉 速いが、精度はほどほど

慎重型（2段階）

まず「物体がありそうな場所」を絞り
その後にクラス分類を行う

👉 遅いが、精度が高い

定義・仕組み（全体像）

1段階モデル（One-stage）

候補領域生成を行わない
位置推定とクラス分類を同時に実施

代表例：

SSD
YOLO

2段階モデル（Two-stage）

第1段階：候補領域（Region Proposal）を生成
第2段階：候補領域ごとに分類・位置補正

代表例：

R-CNN
Fast R-CNN
Faster R-CNN（RPNあり）

いつ使う？（得意・不得意）

1段階モデルが向く場面

リアルタイム処理
動画解析・監視カメラ
組み込み・エッジデバイス

2段階モデルが向く場面

高精度が求められる解析
小さな物体の検出
オフライン処理・研究用途

一発で分かる比較表（最重要）

モデル	段数	主目的	特徴キーワード
YOLO	1段階	速度	Once / グリッド
SSD	1段階	速度	Single Shot / Default Box
R-CNN	2段階	精度	候補領域 / 遅い
Fast R-CNN	2段階	精度	特徴共有 / RoI
Faster R-CNN	2段階	精度	RPN / Proposal

👉 この表をそのまま暗記してOKです。

G検定ひっかけポイント総整理

① 「Faster R-CNNは高速モデル」→ ❌

Fasterは「R-CNNより速い」だけ
SSD / YOLOよりは遅い

② 「Fast R-CNNは候補領域も内製」→ ❌

候補領域は外部手法
内製（RPN）するのは Faster R-CNN

③ 「Anchor / Default Box / RPN の混同」

Default Box：SSD（Anchorの呼び名）
Anchor Box：ひな形の四角
RPN：Faster R-CNN専用（候補領域生成）

まとめ（試験直前用）

まず 1段階 or 2段階 を判定
次に 速度重視 or 精度重視 を判定
RPNが出たら Faster R-CNN
Single / Once が出たら SSD / YOLO

📝 最終判断：

1段階＝速い、2段階＝正確

これで物体検出は切れます。

🔗 関連記事

🏠 G検トップに戻る