ユーチューブを7万時間見続けたAI、最高のマイクラボットになる
オープンAI(OpenAI)が開発した新しいゲーム・ボットは、7万時間分のユーチューブ映像からマインクラフトのプレイを習得した。膨大なネットの映像からAIが学ぶ手法は、ゲーム以外にも応用できそうだ。 by Will Douglas Heaven2022.12.07
オープンAI(OpenAI)は、人気コンピューターゲーム「マインクラフト」の7万時間にもおよぶ人間のプレイ映像を視聴させることで、過去最高のマインクラフト・プレイボットを開発した。ユーチューブのような膨大かつ未開拓の訓練データを利用することで、マインクラフトに限らずさまざまなタスクをこなす機械を訓練できる可能性がある注目の新手法だ。
この「マインクラフトAI」は、キーボードやマウスをクリックする複雑な連続した動作を実行して、木を切り倒したり、道具を作ったといったゲーム内のタスクをこなすことを学習した。ボットとして初めて、「ダイヤモンド・ツール」と呼ばれるアイテムを生成できる。これはマインクラフトの熟練のプレイヤーが、通常、高速で20分間クリックするか、およそ2万4000アクションが必要なタスクである。
この結果、ニューラル・ネットワークに人間が実行するタスクを見せて訓練する、「模倣学習」として知られる技術のブレークスルーがもたらされた。模倣学習は、ロボットアームの制御、車の運転、Webページのナビゲートといった人工知能(AI)の訓練に利用できるものだ。
ネット上には、さまざまなタスクをこなす人間の姿を映した膨大な量の映像がある。こうしたリソースを活用することで、GPT-3が大規模言語モデルに対して実施したのと同じようなことを、模倣学習に適応できるのではないかと研究者は期待している。新しいマインクラフトプレイ・ボット開発チームの一人、オープンAIのボーエン・ベイカーは、「ここ数年、インターネットの広大な空間から得られるデータで訓練された大規模モデルから優れた能力が生まれるという、GPT-3パラダイムの台頭を目の当たりにしてきました」と言う。「GPT-3パラダイムが成功している大きな理由は、人間がオンラインになったときに実行していることをモデル化しているためです」。
模倣学習における既知の問題点は、「この動作をするとこうなる」「その動作をするとああなる」といった具合に、映像のステップごとにラベル付けをしなければならないことだ。手作業によるアノテーション(ラベル付け)は大変な作業なので、データセットは小さくなりがちだ。ベイカーたちは、ネットで公開されている数百万本の映像を新しいデータセットに置き換える方法を模索していた。
ビデオ・プレトレーニング(VPT:Video Pre-Training)と呼ばれるこのアプローチでは、映像に自動的にラベル付けする別のニューラル・ネットワークを訓練させる …
- 人気の記事ランキング
-
- What’s next for Chinese open-source AI ディープシーク騒動から1年 中国のオープンモデルが 世界の開発者を席巻している
- Promotion Emerging Technology Nite #36 Special 【3/9開催】2026年版「新規事業の発想と作り方」開催のお知らせ
- EVs could be cheaper to own than gas cars in Africa by 2040 アフリカでEVがガソリン車より安くなる日——鍵は「太陽光オフグリッド」
- RFK Jr. follows a carnivore diet. That doesn’t mean you should. 「肉か発酵食品しか食べない」米保健長官が目指す「健康な米国」
- Why EVs are gaining ground in Africa アフリカ初のバッテリー工場も建設中、「次のEV市場」は立ち上がるか?
