Skip to the content.

G検定トップ > AlphaGoとAlphaStarの違い【比較チートシート|G検定対策】

まず結論

  • AlphaGoは「単一エージェント強化学習」の代表例。
  • AlphaStarは「マルチエージェント強化学習」の代表例。
  • G検定では「複数プレイヤーを同時に考慮するか」が最大の判断ポイント。

直感的な説明

ざっくり言うと👇

  • AlphaGo
    👉 囲碁を「1対1・交互手番」で戦うAI
  • AlphaStar
    👉 StarCraft II を「リアルタイム・複数ユニット・対戦」で戦うAI

リアルタイム性と同時多人数性が決定的な違いです。

定義・仕組み

AlphaGo(アルファ碁)

  • 対象:囲碁
  • 特徴:
    • 2人対戦
    • 交互に手を打つ
    • 状態が比較的安定
  • 学習の考え方:
    • 単一エージェント強化学習
    • 自分の行動だけを最適化

AlphaStar(アルファスター)

  • 対象:StarCraft II
  • 特徴:
    • 複数プレイヤー
    • リアルタイム進行
    • 多数のユニットが同時に行動
  • 学習の考え方:
    • マルチエージェント強化学習
    • 他エージェントの行動を考慮

いつ使う?(得意・不得意)

AlphaGo が向く問題

  • ターン制ゲーム
  • 状態が明確で変化が遅い環境
  • 1対1の勝負

AlphaStar が向く問題

  • リアルタイム対戦
  • 協調・競争が混在する環境
  • 複数エージェントが同時に存在する問題

G検定ひっかけポイント

ここが 今回あなたが間違えた理由そのものです👇

よくある誤解

  • ❌ 対戦ゲームだから AlphaGo もマルチエージェント
  • ❌ 複数の駒があるからマルチエージェント

正しい判断基準

  • 同時に複数エージェントが存在するか?
    • No → AlphaGo
    • Yes → AlphaStar

超重要ワード対応

  • 「複数プレイヤー」「協調」「競争」→ AlphaStar
  • 「囲碁」「ボードゲーム」「交互手番」→ AlphaGo

まとめ(試験直前用)

  • AlphaGo:単一エージェント強化学習
  • AlphaStar:マルチエージェント強化学習
  • リアルタイム × 複数同時 → AlphaStar
  • 囲碁・交互手番 → AlphaGo
  • 迷ったら「同時かどうか」を見る

🔗 関連記事


🏠 G検トップに戻る