gk cnn
G検定トップ
> GoogLeNet(Inception)とは?G検定対策
まず結論
- GoogLeNet(Inception)とは、複数サイズの畳み込みを並列に適用するInceptionモジュールを用いて、計算量を抑えつつ高精度を実現したCNN。
- G検定では「並列構造」「1×1畳み込み」「VGGより軽量」を理解しているかが問われる。
直感的な説明
-
画像の特徴は、
- 小さな模様
- 大きな構造 どちらも重要です。
- GoogLeNetは、 👉 1つの層で複数の見方(小・中・大)を同時に試す発想のモデルです。
- それを可能にしたのが Inceptionモジュール です。
定義・仕組み
-
Inceptionモジュールでは、
- 1×1 畳み込み
- 3×3 畳み込み
- 5×5 畳み込み
- プーリング を並列に適用し、その出力を結合します。
-
重要ポイント:
- 1×1畳み込みによる次元削減
- パラメータ数・計算量の削減
いつ使う?(得意・不得意)
使われる場面(得意)
- 高精度な画像分類
- 計算資源を抑えたい環境
注意点・不得意
- 構造が複雑で理解しづらい
- 実装がやや難しい
G検定ひっかけポイント
-
よくある誤り表現:
- ❌ 「3×3畳み込みのみを使用」
- ❌ 「シンプルな直列構造」
-
正しい理解:
- 並列構造
- 1×1畳み込みで効率化
-
判断基準:
- 並列・Inception → GoogLeNet
- 3×3積み重ね → VGG
まとめ(試験直前用)
- GoogLeNet=Inceptionモジュール
- 複数サイズ畳み込みを並列処理
- 1×1畳み込みで計算削減
- VGGより軽量
- 「並列」がキーワード
🔗 関連記事
- AlexNet(ディープラーニング革命の起点)とは?G検定対策
- Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】
- Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】
- AutoAugment・RandAugment・TrivialAugmentの違い【画像データ拡張 完全比較|G検定対策】
- Brightness(明るさ調整)とは?【データ拡張|G検定対策】
🏠 G検トップに戻る