gk cnn
G検定トップ
> Rotation / Flip / Crop とは?(幾何変換系データ拡張)【G検定対策】
まず結論
- Rotation / Flip / Crop は、画像の幾何構造を変化させるデータ拡張手法。
- G検定では 「位置・向き・切り出しが変わるが、意味は変えない」という前提を理解しているかが問われる。
直感的な説明
- 同じ物体でも:
- 少し傾いて見える
- 左右が反転して見える
- 一部だけ見える
- 人間は問題なく認識できる。
- これを学習データでも再現するのが
👉 幾何変換系データ拡張。
定義・仕組み
Rotation(回転)
- 内容:
- 画像を一定角度だけ回転
- 変わるもの:
- 向き
- 変わらないもの:
- 物体の意味
- 目的:
- 傾きに対する頑健性
Flip(反転)
- 内容:
- 左右(水平)または上下(垂直)反転
- 変わるもの:
- 左右関係
- 注意:
- 文字・数字・標識では不適切な場合あり
- 目的:
- 視点の違いへの対応
Crop(切り出し)
- 内容:
- 画像の一部を切り出して使用
- 変わるもの:
- 位置・背景
- 変わらないもの:
- 主対象の本質的特徴
- 目的:
- 位置ずれ・スケール変化への対応
いつ使う?(得意・不得意)
得意
- 物体認識
- 一般画像分類
- 視点が一定でない環境
不得意・注意
- 向きに意味があるタスク
- 完全な位置情報が重要な場合
- 過度な Crop による情報欠落
G検定ひっかけポイント
- 色変換系と混同させる問題が多い
- よくある誤解:
- ❌ Rotation = 明るさ調整
- ❌ Flip = 色変換
- ❌ Crop = 解像度変更
- 正しい判断基準:
- 「向き」→ Rotation
- 「左右反転」→ Flip
- 「一部切り出し」→ Crop
- 選択肢での即断:
- 「幾何構造」→ ⭕
- 「色・輝度」→ ❌
まとめ(試験直前用)
- Rotation=向きを変える
- Flip=左右・上下反転
- Crop=一部切り出し
- 色系拡張とは別カテゴリ
- 「形が変わる」=幾何変換系
🔗 関連記事
- AlexNet(ディープラーニング革命の起点)とは?G検定対策
- Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】
- Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】
- AutoAugment・RandAugment・TrivialAugmentの違い【画像データ拡張 完全比較|G検定対策】
- Brightness(明るさ調整)とは?【データ拡張|G検定対策】
🏠 G検トップに戻る