gk cnn convolution
G検定トップ
> 畳み込みニューラルネットワーク(CNN)における畳み込み処理
まず結論
- 畳み込み処理は「積をとって総和する」計算
- 画像とフィルタ(カーネル)を掛け合わせた結果は 特徴マップ と呼ばれる
- CNNが画像の特徴を捉えられる理由の中核となる処理
直感的な説明
畳み込み処理は、
小さなフィルタを画像の上でスライドさせながら 「この形、どれくらい当てはまる?」を計算する
処理です。
- エッジ(輪郭)
- 模様
- 角や線
といった 局所的な特徴 を見つけるのが得意です。
定義・仕組み
畳み込み処理とは
CNNの畳み込み層では、
- 入力画像(または前の層の出力)
- フィルタ(カーネル)
を用いて、次の計算を行います。
各画素 × フィルタの値 を掛け算し、その総和を取る
数式イメージ(重要)
この問題で問われたポイントです。
- (A)積ではなく「総和」
- (B)結果は「特徴マップ」
👉 試験では
- 「平均」「標準偏差」「パディング」などと混同させる
- 「ネオコグニトロン」など別概念を混ぜる
といった ひっかけ が頻出です。
何が得られる?(特徴マップ)
畳み込み処理の結果は 特徴マップ(Feature Map) と呼ばれます。
- フィルタ1枚 → 特徴マップ1枚
- フィルタを複数使う → 複数の特徴マップ
これにより、
- エッジ用フィルタ
- 模様用フィルタ
- 方向別フィルタ
など、異なる特徴を同時に学習できます。
G検定ひっかけポイント
-
❌ 畳み込みは「平均との差分」を取る → 誤り
-
❌ 出力は「ネオコグニトロン」 → 誤り
-
❌ 畳み込み結果はパディングと呼ぶ → 誤り
-
✅ 掛け算して 総和 を取る
-
✅ 出力は 特徴マップ
まとめ(試験直前用)
- 畳み込み処理 = 掛け算 → 総和
- 出力結果 = 特徴マップ
- CNNの画像理解の基礎中の基礎
👉 次は プーリング処理 や ストライド・パディング と合わせて理解すると整理しやすいです。
🔗 関連記事
- AlexNet(ディープラーニング革命の起点)とは?G検定対策
- Atrous Convolution(拡張畳み込み)とは?【DeepLabで使われる理由|G検定対策】
- Atrous ConvolutionとPoolingの違いとは?【受容野と解像度の観点で整理|G検定対策】
- AutoAugment・RandAugment・TrivialAugmentの違い【画像データ拡張 完全比較|G検定対策】
- Brightness(明るさ調整)とは?【データ拡張|G検定対策】
🏠 G検トップに戻る