gk cnn
G検定トップ
> VGG(Very Deep CNN)とは?G検定対策
まず結論
- VGGとは、小さな畳み込み(3×3)を積み重ねてネットワークを深くするという、非常にシンプルな設計思想のCNN。
- G検定では「構造が単純」「パラメータ数が多い」「深いCNN」という特徴を理解しているかが問われる。
直感的な説明
- AlexNetは画期的でしたが、構造はまだ複雑でした。
- VGGは、 👉 「変なことはせず、同じ形の層をひたすら重ねたらどうなる?」 という発想のモデルです。
-
その結果、
- 理解しやすい
- でも重たい という特徴を持つCNNになりました。
定義・仕組み
-
VGGの主な特徴:
- 3×3畳み込みのみを使用
- プーリング層で徐々に解像度を下げる
- ネットワークが非常に深い(VGG16, VGG19)
-
ポイント:
- 構造が一貫している
- パラメータ数・計算量が多い
いつ使う?(得意・不得意)
使われる場面(得意)
- CNNの基本構造の理解
- 特徴抽出器としての転移学習
注意点・不得意
- 計算量・メモリ消費が大きい
- モバイル用途には不向き
G検定ひっかけポイント
-
よくある誤り表現:
- ❌ 「軽量化を目的としたCNN」
- ❌ 「残差接続を持つ」
-
正しい理解:
- シンプル・深い・重たい
-
判断基準:
- 3×3を積む → VGG
- 残差 → ResNet
まとめ(試験直前用)
- VGG=シンプルで深いCNN
- 3×3畳み込みを多用
- 構造が分かりやすい
- パラメータ数が多い
- 軽量モデルではない
🔗 関連記事
- AlexNet(ディープラーニング革命の起点)とは?G検定対策
- Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】
- Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】
- AutoAugment・RandAugment・TrivialAugmentの違い【画像データ拡張 完全比較|G検定対策】
- Brightness(明るさ調整)とは?【データ拡張|G検定対策】
🏠 G検トップに戻る