Skip to the content.

G検定トップ > VGG(Very Deep CNN)とは?G検定対策

まず結論

  • VGGとは、小さな畳み込み(3×3)を積み重ねてネットワークを深くするという、非常にシンプルな設計思想のCNN。
  • G検定では「構造が単純」「パラメータ数が多い」「深いCNN」という特徴を理解しているかが問われる。

直感的な説明

  • AlexNetは画期的でしたが、構造はまだ複雑でした。
  • VGGは、 👉 「変なことはせず、同じ形の層をひたすら重ねたらどうなる?」 という発想のモデルです。
  • その結果、

    • 理解しやすい
    • でも重たい という特徴を持つCNNになりました。

定義・仕組み

  • VGGの主な特徴:

    • 3×3畳み込みのみを使用
    • プーリング層で徐々に解像度を下げる
    • ネットワークが非常に深い(VGG16, VGG19)
  • ポイント:

    • 構造が一貫している
    • パラメータ数・計算量が多い

いつ使う?(得意・不得意)

使われる場面(得意)

  • CNNの基本構造の理解
  • 特徴抽出器としての転移学習

注意点・不得意

  • 計算量・メモリ消費が大きい
  • モバイル用途には不向き

G検定ひっかけポイント

  • よくある誤り表現:

    • ❌ 「軽量化を目的としたCNN」
    • ❌ 「残差接続を持つ」
  • 正しい理解:

    • シンプル・深い・重たい
  • 判断基準:

    • 3×3を積む → VGG
    • 残差 → ResNet

まとめ(試験直前用)

  • VGG=シンプルで深いCNN
  • 3×3畳み込みを多用
  • 構造が分かりやすい
  • パラメータ数が多い
  • 軽量モデルではない

🔗 関連記事


🏠 G検トップに戻る