人工知能、ポーカーでもプロに圧勝

ポーカーでも人間が完敗したとはいえ、人工知能の戦略を可能にしたのはゲーム理論だ。しかし、3人以上の対戦になるとゲーム理論は使えないため、別の理論を作るところから始める必要がある。 by Jamie Condliffe2017.02.01

人工知能による習得は困難だと考えられたゲームで、人間がコンピューターにまた敗北した。

ピッツバーグのリバーズカジノでは、3週間以上にわたり、AIポーカーボットのリブレイタスがプロの熟練ポーカー・プレイヤー集団を相手に、数千回の無制限テキサス・ホールデム対戦をこなしてきた。そしてリブレイタスが圧勝した。

MIT Technology Reviewのウィル・ナイト記者による先日の記事では、リブレイタス（カーネギーメロン大学の研究者2人が開発に関わっている）が勝利する理由が語られており、実現すれば非常に大きなニュースになると書かれていた。

ポーカーは機械による再現が難しい、推理力と知性を要するゲームであり、リブレイタスの勝利は人工知能の大きな進歩といえる。ポーカーがチェッカーや囲碁と根本的に異なるのは、対戦中に相手の手札が見えないことだ。「不完全情報」に基づくゲームで、対戦相手が取りうるあらゆる手を考慮しつつ理想的な戦略を探り出すのはとてつもなく複雑な作業だ。無制限テキサス・ホールデムは実質的に相手の賭けられる金額に制限がないため、特に難易度が高い。

無制限テキサス・ホールデムでは、どの場面でも何か正しい手があるわけではなく、数千回の勝利は事実上不可能に近い。そこでAIはゲーム理論を使って、不確実な状況で最善の動きを計算した。

結局、試合はリブレイタスの圧勝だった。180万ドルのチップを獲得し、プロ4人は全員が最終的に持ち出しになった。人工知能が、無制限テキサス・ホールデムほど情報量の少ないゲームで一流プレーヤーに圧勝するのは初めてのことだ。かつて、ディープマインドが囲碁で勝利を収めたように、リブレイタスの勝利は機械学習の関係者にとって劇的な出来事だ。

では、人間にとってAIとの対戦はどんな感じだったのか？　対戦したプロのひとり、ジェイソン・レスは「ちょっと自信を失うような気分です」とガーディアンに語った。「人間相手の試合で負けても、そこで試合が終わり、休憩が取れます。ここには毎日足を運び、1日につき1時間も負け続けなければいけません。あれほど頻繁に負けるのには慣れていないので、普段とは全く違った感情を抱くことになります」

一方、別のプロであるダニエル・マコーレーはワイヤードに対して、AIがメモリー内に異なる動きを蓄えておける能力は、人間の対戦相手よりもずば抜けていると語った。マコーレーは「リブレイタスは掛け金を3つから5つの金額にわけるのです。そんなことは人間にはできません」という。ただし大敗したプレーヤーに同情する必要はない。負けても、トーナメント中の成績に応じて賞金20万ドルを分配した金額を受け取れるのだ。

AIにとって、今回の勝利は単なる始まりに過ぎない。プロのポーカー・プレイヤーが得意とするゲームでも勝利できると証明されたので、次に待ち受ける課題に備えなければならない。複数プレーヤーを相手にした、無制限テキサス・ホールデムだ。しかし、現在のソフトウェアに用いられているゲーム理論は、対戦相手が2人以上になると機能しない。しかもゲーム理論の代わりになる手法は不明なのだ。

とはいえ、現在の機械学習が進展や、AIポーカーボットは他でも開発されていることを考えると、複数プレーヤーを相手にした試合は不可能そうでも、しばらくすれば実現するかもしれない。

人気の記事ランキング

タグ	イベント関連記事エムテク・デジタル 2017（EmTech Digital 2017）ポーカー人工知能人工知能（AI）機械学習
クレジット	Andrew Rush \| Pittsburgh Post-Gazette via AP

ジェイミーコンドリフ [Jamie Condliffe]米国版ニュース・解説担当副編集長: MIT Technology Reviewのニュース・解説担当副編集長。ロンドンを拠点に、日刊ニュースレター「ザ・ダウンロード」を米国版編集部がある米国ボストンが朝を迎える前に用意するのが仕事です。前職はニューサイエンティスト誌とGizmodoでした。オックスフォード大学で学んだ工学博士です。