gk neural_network
G検定トップ
> Adam(Adaptive Moment Estimation)とは?G検定対策
まず結論
Adam(Adaptive Moment Estimation)は、モーメンタムとRMSpropを組み合わせた最適化手法です。 G検定では、「1次モーメント・2次モーメント」「AdaGrad / RMSprop との関係」が問われます。
直感的な説明
Adamは、
「進む方向の勢いを覚えつつ、場所ごとに学習率を調整する」
最適化手法です。
- モーメンタム:進む方向を安定させる
- RMSprop:学習率を自動で調整する
👉 この2つを同時に使う のが Adam です。
定義・仕組み
Adamでは、次の2つの量を同時に管理します。
① 1次モーメント(平均)
- 勾配の移動平均
- モーメンタムに相当
② 2次モーメント(分散)
- 勾配の二乗の移動平均
- RMSprop に相当
この2つを使って、
- 更新方向を安定させる
- 学習率をパラメータごとに自動調整する
という処理を行います。
いつ使う?(得意・不得意)
得意な点
- 深いニューラルネットワーク
- 勾配が不安定な問題
- 学習率調整が難しい場合
注意点
- 必ずしも最終精度が最良とは限らない
- 収束後は SGD が有利な場合もある
(※ G検定では深掘り不要)
G検定ひっかけポイント
G検定では、次の混同が頻出です。
- Adam と RMSprop の違い
- Adam が全く新しい理論だと思わせる
選択肢の判断基準は次の通りです。
- モーメンタム + RMSprop → Adam
- 過去を忘れる(移動平均)だけ → RMSprop
- 過去をすべて累積 → AdaGrad
まとめ(試験直前用)
- Adamは最適化手法
- モーメンタム + RMSprop の組み合わせ
- 1次モーメント:勢い
- 2次モーメント:学習率調整
- G検定頻出
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る