Skip to the content.

G検定トップ > EfficientNet(Compound Scaling による高効率CNN)

まず結論

EfficientNet は、画像認識向けに設計された CNN であり、 「深さ・幅・入力解像度」を同時にバランスよく拡張する Compound Scaling によって、高精度と高効率を両立したモデルです。

G検定では、 👉 「深さだけ/幅だけ」ではなく「3つ同時に拡張する」 👉 「画像モデルであり、時系列モデルではない」 という2点を切り分けられるかが問われます。


直感的な説明

CNN の性能を上げる方法には、

  • ネットワークを深くする(ResNet)
  • チャネル数を増やす(WideResNet)
  • 入力画像を高解像度にする

といった方法があります。

EfficientNet は、

👉 どれか1つだけを極端に伸ばすのではなく、 「深さ・幅・解像度」を少しずつ同時に成長させる

という考え方です。

人に例えると、

  • 筋肉だけ鍛える
  • 身長だけ伸ばす

のではなく、

👉 体格・筋力・持久力をバランスよく鍛える

イメージです。


定義・仕組み

EfficientNet

  • Google が提案した CNN アーキテクチャ

  • NAS(Neural Architecture Search)を用いてベースモデル(B0)を設計

  • Compound Scaling により、次の3つを同時に拡張

    • 深さ(depth)
    • 幅(width)
    • 入力解像度(resolution)
  • EfficientNet-B0 を基準に、B1〜B7 へスケール

👉 少ない計算量で高精度を実現


いつ使う?(得意・不得意)

得意なタスク

  • 画像分類
  • 画像認識
  • 視覚検査

👉 画像 × CNN × 高効率


苦手・注意が必要なタスク

  • 音声の時系列データ(波形そのもの)
  • テキストの系列データ

※ スペクトログラムなど 画像に変換した場合 は CNN を使えるが、 それは「前処理で画像化している」点に注意。


G検定ひっかけポイント

① 「EfficientNet は深くしたモデルである」

❌ 不正解。

  • 深さ だけ を拡張 → ResNet
  • だけ を拡張 → WideResNet
  • 深さ・幅・解像度を同時に拡張 → EfficientNet

② 「高性能なので何にでも使える」

❌ 不正解。

  • EfficientNet は 画像向け CNN
  • 音声・テキストの時系列を直接扱うモデルではない

③ 音声を画像化すれば OK?

  • スペクトログラムに変換すれば CNN を使うことは可能
  • ただし問題文に

    • 「音声の時系列データを扱う」

とあれば、EfficientNet は 不適切


まとめ(試験直前用)

  • EfficientNet=Compound Scaling
  • 深さ・幅・解像度を同時に拡張
  • 高精度・高効率な画像向け CNN
  • 時系列モデルではない

👉 迷ったら

EfficientNet = 画像 × バランス設計

🔗 関連記事


🏠 G検トップに戻る