Skip to the content.

G検定トップ > YOLO(You Only Look Once)

まず結論

YOLOは「1段階モデル」で、主な目的は「処理速度の高速化」です。 画像全体を一度だけ見て、位置推定とクラス分類を同時に行います。

👉 G検定では、「YOLO=1段階・高速」と即断できるかが重要です。


直感的な説明

YOLOは名前の通り、

  • You Only Look Once(1回だけ見る)
  • 画像を細かく何度も調べ直さない

という考え方の物体検出です。

🔍 風景を一度パッと見て、 「ここに人」「ここに車」と一気に判断するイメージです。

SSDよりもさらに 「全体をまとめて判断する」感覚が強いモデルです。


定義・仕組み

YOLOは、

  • 画像を グリッド(格子) に分割し
  • 各グリッドごとに

    • 物体らしさ
    • クラス
    • バウンディングボックス

同時に予測する 1段階物体検出モデルです。

ポイント

  • 候補領域生成(RPN)は 存在しない
  • 1回の推論で全てを出力

👉 SSDと同じ1段階だが、考え方は少し違うのが特徴です。


いつ使う?(得意・不得意)

得意なこと

  • リアルタイム動画解析
  • 自動運転・監視カメラ
  • FPSが重要なアプリケーション

苦手なこと

  • 非常に小さい物体の検出
  • 位置精度を極限まで求める場面

👉 「とにかく速いが、精度はそこそこ」という立ち位置です。


G検定ひっかけポイント

① 「YOLOは精度向上が目的」→ ❌

❌ よくある誤解:

YOLOは高精度な物体検出を実現するためのモデルである

⭕ 正しくは:

YOLOの主目的は処理速度の高速化

精度重視は Faster R-CNN です。


② 「YOLOは2段階モデル」→ ❌

  • ❌ 候補領域生成 → 分類 → 2段階
  • ⭕ 位置+クラスを一気に出す → 1段階(YOLO, SSD)

👉 名前通り「Once」=1段階と覚えると切れます。


③ SSDとの混同

  • YOLO:グリッド分割ベース
  • SSD:Anchor(Default Box)ベース

👉 G検定では違いより「両方1段階・高速」を優先。


まとめ(試験直前用)

  • YOLOは 1段階物体検出モデル
  • 画像を一度だけ見て判断
  • 主目的は 処理速度の高速化
  • 精度重視は Faster R-CNN

📝 選択肢で迷ったら:

「YOLO=Once=1段階・高速」

これで切れます。

🔗 関連記事


🏠 G検トップに戻る