「アルファ碁ゼロ」が登場、完全な教師なし学習で世界最強に

囲碁世界一の伝説の棋士に勝った人工知能（AI）プログラム「アルファ碁」を圧倒する新プログラムが登場した。多層ニューラルネットワークと強化学習に基づくこのプログラムは、人間が訓練用のデータを用意しなくても、自分自身で独学して強くなることができる。 by Will Knight2017.10.19

深層学習プログラムの「アルファ碁（AlphaGo）」が地上最強の棋士として君臨できたのは短い期間だった。匠の技を極めた怪物級の新人工知能（AI）プログラム「アルファ碁ゼロ（AlphaGo Zero）」が登場したのだ。アルファ碁ゼロはアルファ碁との対戦で100戦100勝と、まったく付け入る隙を与えなかった。

すごいのは、アルファ碁ゼロがいかにして技を極めたかである。オリジナルのアルファ碁は人間の棋士の無数の棋譜から対戦データを取り入れて学習した。これに対して、アルファ碁と同じく、アルファベット（グーグル）の子会社ディープマインドが開発したアルファ碁ゼロは、碁盤と囲碁のルール以外何も知らないところからスタートした。自分自身を相手に数百万回の対局をこなして、自分自身を改良していったのだ。

この新しいプログラムにより、本物の知能を持つ機械を構築する探究が大きく前進する。学習するための大量の訓練データがなくても、機械が難しい問題の解決法を導き出すからだ。

「最も衝撃なのは、もはや人間のデータを用意しなくても済むことです」とディープマインドの最高経営責任者（CEO）兼共同創業者のデミス・ハサビス（Demis Hassabis）はいう。ハサビスCEOによると、アルファ碁ゼロの構築に使った手法は、創薬や材料科学などさまざまな可能性を秘めた幅広い分野において、現実の状況に十分通用するものだという。アルファ碁ゼロに関する研究は10月18日、科学雑誌のネイチャー（Nature）に掲載された。

驚くべきことに、アルファ碁ゼロは独学中に、人間の棋士が数千年かけて培った技や手法を数多く発見した。「数日で優れた対局を再発見して、最終的にはそれらを超越し、さらに優れたものにします」とハサビスCEOは述べている。「見ていると、わくわくします」。

ロンドンに拠点を置くディープマインドは2014年グーグルに買収された。ゲームの対戦、シミュレーション、機械学習を通じて、人工知能の分野で大きな躍進を遂げることを目指しており、数百人のAI研究者を雇って目標を追求している。コンピューティング・リソースの観点 …

こちらは有料会員限定の記事です。 有料会員になると制限なしにご利用いただけます。

有料会員にはメリットがいっぱい！

毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
重要テーマが押さえられる。
各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。

人気の記事ランキング