gk neural_network rnn lstm
G検定トップ
> LSTMの内部構造(CECと学習アルゴリズムの切り分け)
まず結論
LSTMの本質は「ゲート」そのものではなく、 誤差を長期間保持できる記憶素子 CEC(Constant Error Carousel)にあります。
G検定では、 👉 LSTMの構成要素(構造)と学習方法(アルゴリズム)を 正しく切り分けられるか が問われます。
このページの立ち位置
このページでは、
- ゲートの基本説明
- 勾配消失の一般論
は 既存の LSTM ページに譲り、
👉 「LSTM固有の内部構造」と「よくある混同」 に焦点を当てます。
LSTMブロックを構成する要素(G検定向け)
LSTMブロックは、次の2系統の要素で構成されます。
① 制御のための要素
- 入力ゲート
- 忘却ゲート
- 出力ゲート
👉 情報の出入りを制御する役割
② 記憶のための要素(最重要)
- CEC(Constant Error Carousel)
👉 LSTMの「記憶の本体」
CEC(Constant Error Carousel)とは何か
CECは、
- 誤差(勾配)を
- ほぼ一定のまま
- 時間方向に伝播させる
ための構造です。
これにより、
- 古い情報が消えない
- 長期依存関係を学習できる
ようになります。
👉 LSTMがRNNと決定的に違う点
なぜCECが重要なのか(試験視点)
G検定では、
LSTMブロックは、入力・出力・忘却ゲート機構と、 ( )と呼ばれる記憶素子から構成される
という 穴埋め問題 が頻出です。
この( )に入るのは👇
- ❌ BPTT(学習アルゴリズム)
- ❌ Attention(重み付け機構)
- ❌ GRU(別モデル)
- ✅ CEC(記憶素子)
よくある混同の整理
BPTTとの違い
- CEC:ネットワーク内部の構造
- BPTT:時間方向に誤差を伝える学習アルゴリズム
👉 役割がまったく違う
GRUとの違い
- GRU:LSTMを簡略化したRNN
- CECという独立した記憶素子は持たない
Attentionとの違い
- Attention:どの情報を重視するかの仕組み
- LSTMの内部構造とは別概念
まとめ(試験直前用)
- LSTMの記憶素子は CEC
- ゲートは制御、CECは記憶
- BPTTは学習法であり構造ではない
👉 迷ったら
LSTMの穴埋め問題 = CEC
🔗 関連記事
- CLIP(画像とテキストの対応付けモデル)とは?G検定対策
- PaLM(大規模言語モデル)とは?G検定対策
- PaLM-E(環境対応マルチモーダルモデル)とは?G検定対策
- TF-IDF・Word2Vec・BERTの違いとは?役割で整理するNLP基礎【G検定対策】
- A2C / A3C とは?(Actor–Critic の実装差)【G検定対策】
🏠 G検トップに戻る