gk reinforcement_learning cheatsheet
G検定トップ
> AlphaGoとAlphaStarの違い【比較チートシート|G検定対策】
まず結論
- AlphaGoは「単一エージェント強化学習」の代表例。
- AlphaStarは「マルチエージェント強化学習」の代表例。
- G検定では「複数プレイヤーを同時に考慮するか」が最大の判断ポイント。
直感的な説明
ざっくり言うと👇
- AlphaGo
👉 囲碁を「1対1・交互手番」で戦うAI - AlphaStar
👉 StarCraft II を「リアルタイム・複数ユニット・対戦」で戦うAI
リアルタイム性と同時多人数性が決定的な違いです。
定義・仕組み
AlphaGo(アルファ碁)
- 対象:囲碁
- 特徴:
- 2人対戦
- 交互に手を打つ
- 状態が比較的安定
- 学習の考え方:
- 単一エージェント強化学習
- 自分の行動だけを最適化
AlphaStar(アルファスター)
- 対象:StarCraft II
- 特徴:
- 複数プレイヤー
- リアルタイム進行
- 多数のユニットが同時に行動
- 学習の考え方:
- マルチエージェント強化学習
- 他エージェントの行動を考慮
いつ使う?(得意・不得意)
AlphaGo が向く問題
- ターン制ゲーム
- 状態が明確で変化が遅い環境
- 1対1の勝負
AlphaStar が向く問題
- リアルタイム対戦
- 協調・競争が混在する環境
- 複数エージェントが同時に存在する問題
G検定ひっかけポイント
ここが 今回あなたが間違えた理由そのものです👇
よくある誤解
- ❌ 対戦ゲームだから AlphaGo もマルチエージェント
- ❌ 複数の駒があるからマルチエージェント
正しい判断基準
- 同時に複数エージェントが存在するか?
- No → AlphaGo
- Yes → AlphaStar
超重要ワード対応
- 「複数プレイヤー」「協調」「競争」→ AlphaStar
- 「囲碁」「ボードゲーム」「交互手番」→ AlphaGo
まとめ(試験直前用)
- AlphaGo:単一エージェント強化学習
- AlphaStar:マルチエージェント強化学習
- リアルタイム × 複数同時 → AlphaStar
- 囲碁・交互手番 → AlphaGo
- 迷ったら「同時かどうか」を見る
🔗 関連記事
- NISC・IPA・JPCERT/CC・CSIRTの違いまとめ【一発で切れるチートシート】
- データ・AI利活用における留意事項とは?【DS検定リテラシー】
- データを読む・説明する・扱うとは?データリテラシー実践ガイド【DS検定】
- 数理・アルゴリズム・データ活用基礎(オプション)【DS検定対応】
- ④ Assistant Data Scientist(見習い)に求められるビジネス力
🏠 G検トップに戻る