2019年10月、囲碁より難しいとされる戦略ゲームでAIが人間に勝った。「たかがゲーム」と侮っては本質を見誤る。がん診断などでも専門医を超え始めた。先頭を走るのは米グーグル(Google)だ。

 囲碁の世界トッププロに勝利したAI「AlphaGo」の開発実績で知られる、グーグル系AI開発会社の英ディープマインド(DeepMind)が2019年10月、再び世界を驚かせた。同社が開発したAI「AlphaStar」がリアルタイム戦略ゲーム「StarCraft II」のオンライン対戦で「世界の上位0.2%入り(グランドマスターレベル)を達成した」と発表したのだ。StarCraft IIは米ブリザードエンターテインメント(Blizzard Entertainment)が開発しオンラインで提供する戦略ゲームである。

囲碁と戦略ゲーム「StarCraft II」の比較
囲碁より現実世界に近く複雑だ(写真(左):123RF、写真(右):米ブリザードエンターテインメント)
[画像のクリックで拡大表示]

 StarCraft IIは日本語版がなく日本での知名度は高くない。しかし世界的には人気の高いゲームで、多数の「プロゲーマー」も存在する。StarCraft IIでAIが人間に勝つのは囲碁や将棋で勝つよりも難しいと考えられてきた。そのためAlphaStarの「偉業」は米CNNなどの一般メディアも取り上げるなど欧米で関心を集めている。

 StarCraft IIがAIにとって難しいと考えられてきたのは、囲碁や将棋に比べてルールや判断が複雑だからだ。StarCraft IIはSFを題材にした戦略ゲームで、プレーヤーは数百のユニット(駒)にリアルタイムに指示を出して相手を攻撃する。囲碁や将棋のような交互に操るターン制ではない。

 囲碁や将棋に比べて「視界」が狭いことも複雑さにつながる。StarCraft IIのプレーヤーは「カメラ」を通じてマップの一部だけが見える。味方の周辺以外は相手の情報が見えない。プレーヤーは限られた情報に基づいて次の1手を考える必要がある。

 さらにStarCraft IIのユニットには相手を攻撃する「戦闘ユニット」だけでなく、資源を収集してユニットや建物をつくる「労働者ユニット」など様々な種類がある。加えて絶対的に強いユニットは存在せず、ユニットの種類に応じてじゃんけんのグー・チョキ・パーのような力関係がある。プレーヤーは攻撃プランといった短期戦略と同時に、ユニット生産計画といった長期戦略も考慮する必要がある。

 ディープマインドはAlphaStarを「深層強化学習」によって開発した。コンピューターが試行錯誤を通じてタスクを実行する最適なやり方を学習していく「強化学習」と、ニューラルネットワークを多段に組み合わせる「ディープラーニング(深層学習)」を組み合わせた機械学習の手法だ。

 深層強化学習ではコンピューターのプレーヤー(エージェント)同士を実際に対戦させて試行錯誤を繰り返す。エージェントは対戦を重ねながらゲームに勝つという「報酬」を得やすいように自身の戦略(ポリシー)を更新して強くなっていく。

AIによる人間超えの年表
より複雑なタスクをこなせるように
[画像のクリックで拡大表示]

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。