gk cnn neural_network
G検定トップ
> Random CropとRandom Translationの違いとは?【画像データ拡張|G検定対策】
まず結論
- Random Cropは「画像の一部を切り出す」データ拡張、
Random Translationは「画像全体を平行移動させる」データ拡張である。 - G検定では「切るか・動かすか」で即座に判別する。
直感的な説明
2つは似ていますが、やっていることは違います。
- Random Crop
👉 写真の一部をランダムに切り抜く - Random Translation
👉 写真全体を左右・上下にずらす
たとえると、
- Crop=トリミング
- Translation=スライド
です。
定義・仕組み
Random Crop
- 元画像から ランダムな位置・サイズの領域を切り出す
- 切り出した後、元のサイズにリサイズすることが多い
目的:
- 部分的な特徴への頑健性向上
- 物体の位置ずれへの耐性
重要:
- 画像の一部が欠ける
- 視野が狭くなる
Random Translation
- 画像全体を 左右・上下に平行移動
- 移動により端が欠ける場合は
- 0埋め
- パディング
- 反射 などで補完される
目的:
- 位置ずれへの耐性向上
重要:
- 画像全体は保持される
- 切り取りはしない
いつ使う?(得意・不得意)
Random Cropが得意な場面
- 物体検出・分類
- 部分特徴が重要なタスク
- 過学習を強く抑えたい場合
Random Translationが得意な場面
- 位置ずれに強いモデルを作りたい
- 画像全体の構造を保ちたい場合
注意点(共通)
- 文字認識や医療画像では要注意
- 重要部分が欠けると性能低下の可能性
G検定ひっかけポイント
ここが最重要です。
よくある誤解
- ❌「Random Cropは移動である」
- ❌「Random Translationは切り取りである」
- ❌「Flipと同じ意味」
- ❌「色変換の手法」
正しい判断基準
- 切り出す → Random Crop
- ずらす → Random Translation
- 反転 → Random Flip
- 色 → Color Jitter
問題文に
「切り出す」「一部を抽出」
とあれば Random Crop。
「平行移動」「左右・上下に移動」
とあれば Random Translation。
最終比較表(これだけ見ればOK)
| 観点 | Random Crop | Random Translation | |—|—|—| | 操作内容 | 切り出し | 平行移動 | | 画像の欠損 | あり | 端のみ | | 視野 | 狭くなる | 変わらない | | 主目的 | 部分頑健性 | 位置頑健性 | | 混同注意 | Translation | Crop |
まとめ(試験直前用)
- Crop=切る
- Translation=ずらす
- Flip=反転
- 色は別カテゴリ
- 動詞で判断する
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る