物体検出・セマンティック・インスタンスの違い【3点比較チート｜G検定対策】 | AI・データサイエンス・IT学習ノート

gk cnn cheatsheet

G検定トップ＞物体検出・セマンティック・インスタンスの違い【3点比較チート｜G検定対策】

まず結論

画像認識タスクは、「箱で位置を知りたい」→物体検出、「種類ごとに塗り分けたい」→セマンティックセグメンテーション、「個体ごとに領域まで分けたい」→インスタンスセグメンテーションで使い分けられ、G検定ではこの3つの違いを即断できるかが問われる。

直感的な説明

同じ写真に「人が3人」写っているとします。

物体検出：
- 人が「どこに何人いるか」を四角で囲む
セマンティックセグメンテーション：
- 人の部分を全部まとめて同じ色で塗る
インスタンスセグメンテーション：
- 人を1人ずつ別の色で塗り分ける

👉 個体を区別するかどうかが最大の違いです。

定義・仕組み（3点比較）

タスク	何が分かる？	個体の区別	出力形式
物体検出	種類＋位置	×	バウンディングボックス
セマンティック	クラス	×	ピクセル（クラス別）
インスタンス	クラス＋個体	○	ピクセル（個体別）

いつ使う？（得意・不得意）

物体検出

物体の位置が分かれば十分な場合
人数カウント、検出タスク

セマンティックセグメンテーション

領域の意味が分かればよい場合
道路・空・建物などの分類

インスタンスセグメンテーション

同じ物体を個体ごとに扱いたい場合
自動運転、医療画像、ロボット認識

G検定ひっかけポイント

G検定では、「セグメンテーション」という言葉だけで判断させる選択肢が出ます。

よくある誤解

セマンティックでも個体を区別できる → ✕
インスタンスは検出だけで領域は分からない → ✕

正誤を切る判断基準

箱だけ？ → 物体検出
クラスごと？ → セマンティック
個体ごと？ → インスタンス

まとめ（試験直前用）

物体検出：位置を知る
セマンティック：種類を塗る
インスタンス：個体ごとに塗る
最大の違いは「個体を区別するか」
G検定では3つセットで比較される

🔗 関連記事

🏠 G検トップに戻る