Skip to the content.

G検定トップ > インスタンスセグメンテーションとは?(物体検出・セマンティックとの違い)【G検定対策】

まず結論

インスタンスセグメンテーション(Instance Segmentation)とは、画像中の各物体を「種類」だけでなく「個体ごと」に分けて、領域(ピクセル単位)まで特定する手法であり、G検定では「物体検出・セマンティックセグメンテーションとの違い」を正確に区別できるかが問われる。

直感的な説明

インスタンスセグメンテーションは、

同じクラスの物体が複数あっても、 「どれがどれか」を1つずつ塗り分ける

イメージです。

例えば画像に「人」が3人写っている場合:

  • 人というクラスは同じ
  • でも Aさん・Bさん・Cさん と個体は別

これを

  • 1人ずつ別の領域として認識

するのがインスタンスセグメンテーションです。

定義・仕組み

画像認識タスクの関係は次の通りです。

  • 画像分類:画像全体に1ラベル
  • 物体検出:物体の位置(バウンディングボックス)+クラス
  • セマンティックセグメンテーション:クラスごとにピクセル分類(個体の区別なし)
  • インスタンスセグメンテーション

    • クラス分類
    • 個体ごとの識別
    • ピクセル単位の領域分割

つまり、

検出 + セグメンテーション

を同時に行うタスクです。

代表的なモデルとしては、

  • Mask R-CNN

があります。

いつ使う?(得意・不得意)

得意なケース

  • 同じ物体が複数存在する画像
  • 個体ごとの形状や面積が重要な場合
  • 自動運転・医療画像・監視カメラ

注意点

  • モデルが複雑
  • 計算コストが高い
  • 学習データのアノテーションが大変

G検定ひっかけポイント

G検定では、セマンティックセグメンテーションとの混同が頻出です。

よくある混同

  • 個体を区別しないセグメンテーション → セマンティック
  • バウンディングボックスだけ → 物体検出

正誤を切る判断基準

  • 個体ごとに分ける? → インスタンスセグメンテーション
  • クラスだけ分ける? → セマンティックセグメンテーション
  • 箱で囲むだけ? → 物体検出

まとめ(試験直前用)

  • インスタンスセグメンテーションは個体識別+領域分割
  • 同じクラスでも別インスタンスとして扱う
  • 物体検出・セマンティックとの違いが重要
  • Mask R-CNNが代表例
  • G検定では「個体を区別するか」で判断

🔗 関連記事


🏠 G検トップに戻る