Skip to the content.

G検定トップ > CNN(畳み込みニューラルネットワーク)

まず結論

  • CNNは画像認識に特化したニューラルネットワーク
  • 畳み込みとプーリング により特徴を段階的に抽出する
  • 全結合(MLP)より 空間構造をうまく扱える

直感的な説明

CNNは、

「画像を一気に理解するのではなく、部分 → 全体へと見ていく仕組み」

です。

  • まずは エッジや角 のような単純な特徴
  • 次に 模様やパーツ
  • 最後に 物体全体

というように、 層が深くなるほど抽象度が上がる のが特徴です。


定義・仕組み

CNNの基本構成

CNNは主に次の層で構成されます。

  1. 畳み込み層(Convolution Layer)
  2. 活性化関数(主にReLU)
  3. プーリング層(Pooling Layer)
  4. 全結合層(Fully Connected Layer)

これらを繰り返し、 最後に分類や回帰を行います。


畳み込みとは?

  • 小さなフィルタ(カーネル)を画像上で滑らせる
  • 局所的な特徴を検出
  • 重み共有 によりパラメータ数を削減

これが、CNNが画像に強い最大の理由です。


プーリングとは?

  • 特徴マップを 縮小 する処理
  • 位置のズレに強くなる(平行移動への頑健性)

いつ使う?(得意・不得意)

得意なこと

  • 画像分類・物体検出・画像認識全般
  • 空間構造を持つデータの処理

苦手なこと

  • 時系列データ(→ RNN)
  • 単純な表形式データ(→ MLP)

G検定ひっかけポイント

  • ❌「CNNは全結合層のみで構成される」→ 誤り
  • ❌「畳み込みは画像全体を一度に処理する」→ 誤り
  • 重み共有局所受容野 がキーワード
  • ✅ プーリングは特徴量を縮小する

まとめ(試験直前用)

  • CNNは 画像向けNN
  • 畳み込みで局所特徴を抽出
  • 重み共有でパラメータ削減
  • 次は 畳み込みの詳細 を理解すると定着する

👉 次は 畳み込み(フィルタ・ストライド・パディング) を詳しく見ていきます。

🔗 関連記事


🏠 G検トップに戻る