Skip to the content.

G検定トップ > Rotation / Flip / Crop とは?(幾何変換系データ拡張)【G検定対策】

まず結論

  • Rotation / Flip / Crop は、画像の幾何構造を変化させるデータ拡張手法
  • G検定では 「位置・向き・切り出しが変わるが、意味は変えない」という前提を理解しているかが問われる。

直感的な説明

  • 同じ物体でも:
    • 少し傾いて見える
    • 左右が反転して見える
    • 一部だけ見える
  • 人間は問題なく認識できる。
  • これを学習データでも再現するのが
    👉 幾何変換系データ拡張

定義・仕組み

Rotation(回転)

  • 内容:
    • 画像を一定角度だけ回転
  • 変わるもの:
    • 向き
  • 変わらないもの:
    • 物体の意味
  • 目的:
    • 傾きに対する頑健性

Flip(反転)

  • 内容:
    • 左右(水平)または上下(垂直)反転
  • 変わるもの:
    • 左右関係
  • 注意:
    • 文字・数字・標識では不適切な場合あり
  • 目的:
    • 視点の違いへの対応

Crop(切り出し)

  • 内容:
    • 画像の一部を切り出して使用
  • 変わるもの:
    • 位置・背景
  • 変わらないもの:
    • 主対象の本質的特徴
  • 目的:
    • 位置ずれ・スケール変化への対応

いつ使う?(得意・不得意)

得意

  • 物体認識
  • 一般画像分類
  • 視点が一定でない環境

不得意・注意

  • 向きに意味があるタスク
  • 完全な位置情報が重要な場合
  • 過度な Crop による情報欠落

G検定ひっかけポイント

  • 色変換系と混同させる問題が多い
  • よくある誤解:
    • ❌ Rotation = 明るさ調整
    • ❌ Flip = 色変換
    • ❌ Crop = 解像度変更
  • 正しい判断基準:
    • 「向き」→ Rotation
    • 「左右反転」→ Flip
    • 「一部切り出し」→ Crop
  • 選択肢での即断:
    • 「幾何構造」→ ⭕
    • 「色・輝度」→ ❌

まとめ(試験直前用)

  • Rotation=向きを変える
  • Flip=左右・上下反転
  • Crop=一部切り出し
  • 色系拡張とは別カテゴリ
  • 「形が変わる」=幾何変換系

🔗 関連記事


🏠 G検トップに戻る