最終更新日:2026年5月6日
gk neural_network transformer
G検定トップ
> PaLM(大規模言語モデル)とは?G検定対策
まず結論
- PaLM(Pathways Language Model)とは、大規模データと大規模計算資源を用いて学習された高性能な大規模言語モデル(LLM)である。
- G検定では「純粋な言語モデルか?マルチモーダルか?」を問われることが多い。
直感的な説明
PaLMは、
「とにかく文章理解と文章生成がめちゃくちゃ強いAI」です。
- 長い文章を読める
- 文脈を理解できる
- 推論・説明・要約ができる
ただし、 👉 画像は見えません。
定義・仕組み
PaLMは Google(DeepMind)が開発した Transformerベースの大規模言語モデルです。
特徴は以下の通りです。
- Transformer アーキテクチャ
- 超大規模パラメータ
- 自然言語処理(NLP)専用
- 推論・生成・質問応答に強い
重要ポイント:
- マルチモーダルではない
- テキストのみを扱う
いつ使う?(得意・不得意)
得意なこと
- 文章生成
- 質問応答
- 推論問題
- コード生成や説明
不得意・注意点
- 画像理解はできない
- 音声・視覚を直接扱えない
- ロボット制御には直接使えない
G検定ひっかけポイント
G検定では以下の混同が頻出です。
- ❌ Flamingo(マルチモーダル)
- ❌ PaLM-E(環境・ロボット対応)
- ❌ CLIP(画像×テキスト)
判断基準
- テキストのみ → PaLM
- 画像が出てきたら → PaLMではない
まとめ(試験直前用)
- PaLMは 大規模言語モデル(LLM)
- テキスト専用
- Transformerベース
- マルチモーダルではない
- 「言語理解・生成」ならPaLM