gk neural_network cnn
G検定トップ
> CNN(畳み込みニューラルネットワーク)
まず結論
- CNNは画像認識に特化したニューラルネットワーク
- 畳み込みとプーリング により特徴を段階的に抽出する
- 全結合(MLP)より 空間構造をうまく扱える
直感的な説明
CNNは、
「画像を一気に理解するのではなく、部分 → 全体へと見ていく仕組み」
です。
- まずは エッジや角 のような単純な特徴
- 次に 模様やパーツ
- 最後に 物体全体
というように、 層が深くなるほど抽象度が上がる のが特徴です。
定義・仕組み
CNNの基本構成
CNNは主に次の層で構成されます。
- 畳み込み層(Convolution Layer)
- 活性化関数(主にReLU)
- プーリング層(Pooling Layer)
- 全結合層(Fully Connected Layer)
これらを繰り返し、 最後に分類や回帰を行います。
畳み込みとは?
- 小さなフィルタ(カーネル)を画像上で滑らせる
- 局所的な特徴を検出
- 重み共有 によりパラメータ数を削減
これが、CNNが画像に強い最大の理由です。
プーリングとは?
- 特徴マップを 縮小 する処理
- 位置のズレに強くなる(平行移動への頑健性)
いつ使う?(得意・不得意)
得意なこと
- 画像分類・物体検出・画像認識全般
- 空間構造を持つデータの処理
苦手なこと
- 時系列データ(→ RNN)
- 単純な表形式データ(→ MLP)
G検定ひっかけポイント
- ❌「CNNは全結合層のみで構成される」→ 誤り
- ❌「畳み込みは画像全体を一度に処理する」→ 誤り
- ✅ 重み共有 と 局所受容野 がキーワード
- ✅ プーリングは特徴量を縮小する
まとめ(試験直前用)
- CNNは 画像向けNN
- 畳み込みで局所特徴を抽出
- 重み共有でパラメータ削減
- 次は 畳み込みの詳細 を理解すると定着する
👉 次は 畳み込み(フィルタ・ストライド・パディング) を詳しく見ていきます。
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る