gk 画像認識 物体検出
G検定トップ
> YOLO(You Only Look Once)
まず結論
YOLOは「1段階モデル」で、主な目的は「処理速度の高速化」です。 画像全体を一度だけ見て、位置推定とクラス分類を同時に行います。
👉 G検定では、「YOLO=1段階・高速」と即断できるかが重要です。
直感的な説明
YOLOは名前の通り、
- You Only Look Once(1回だけ見る)
- 画像を細かく何度も調べ直さない
という考え方の物体検出です。
🔍 風景を一度パッと見て、 「ここに人」「ここに車」と一気に判断するイメージです。
SSDよりもさらに 「全体をまとめて判断する」感覚が強いモデルです。
定義・仕組み
YOLOは、
- 画像を グリッド(格子) に分割し
-
各グリッドごとに
- 物体らしさ
- クラス
- バウンディングボックス
を同時に予測する 1段階物体検出モデルです。
ポイント
- 候補領域生成(RPN)は 存在しない
- 1回の推論で全てを出力
👉 SSDと同じ1段階だが、考え方は少し違うのが特徴です。
いつ使う?(得意・不得意)
得意なこと
- リアルタイム動画解析
- 自動運転・監視カメラ
- FPSが重要なアプリケーション
苦手なこと
- 非常に小さい物体の検出
- 位置精度を極限まで求める場面
👉 「とにかく速いが、精度はそこそこ」という立ち位置です。
G検定ひっかけポイント
① 「YOLOは精度向上が目的」→ ❌
❌ よくある誤解:
YOLOは高精度な物体検出を実現するためのモデルである
⭕ 正しくは:
YOLOの主目的は処理速度の高速化
精度重視は Faster R-CNN です。
② 「YOLOは2段階モデル」→ ❌
- ❌ 候補領域生成 → 分類 → 2段階
- ⭕ 位置+クラスを一気に出す → 1段階(YOLO, SSD)
👉 名前通り「Once」=1段階と覚えると切れます。
③ SSDとの混同
- YOLO:グリッド分割ベース
- SSD:Anchor(Default Box)ベース
👉 G検定では違いより「両方1段階・高速」を優先。
まとめ(試験直前用)
- YOLOは 1段階物体検出モデル
- 画像を一度だけ見て判断
- 主目的は 処理速度の高速化
- 精度重視は Faster R-CNN
📝 選択肢で迷ったら:
「YOLO=Once=1段階・高速」
これで切れます。
🔗 関連記事
- Anchor Box / Default Box / RPN
- Faster R-CNN
- 物体検出モデル総まとめ(SSD / YOLO / R-CNN系)
- R-CNN / Fast R-CNN
- SSD(Single Shot MultiBox Detector)
🏠 G検トップに戻る