KADOKAWA Technology Review
×
【新規購読者限定】ひと月あたり1000円で始められるキャンペーン実施中!
他者を言葉で動かす方法を学習、目的達成手段として言語を使うAI
Facebook
How role-playing a dragon can teach an AI to manipulate and persuade

他者を言葉で動かす方法を学習、目的達成手段として言語を使うAI

ジョージア工科大学の研究者のチームは、自然言語処理と強化学習を組み合わせることにより、目的を達成するために言葉を使って他者に何かをさせるAIシステムを開発した。言語に満ちた私たちの世界がどのように成り立っているかを、より深く理解することにつながるかもしれない。 by Will Douglas Heaven2020.12.24

テキスト・ベースのアドベンチャーゲームで、いろいろなキャラクターに話しかけて、目的を達成する人工知能(AI)は、何かをする方法だけでなく、他者に何かをさせる方法も学習する。このシステムは、言語を使って目的を達成できるマシンへ一歩近づいた。

GPT-3のような言語モデルは、人間が書いた文章を真似ることに長けており、物語や偽のブログ、レディット(Reddit)の投稿などを大量に作り出す。しかし、その大量の成果物は、テキストを生成すること自体を目的として作られたものだ。一方、人々が言語を使うときには、言語は何かを達成するための手段となる。言葉は、人々を説得、命令、操り、時には笑わせたり泣かせたりもする。

何らかの理由をもって言葉を使うAIを構築するにはどうすればよいのだろうか。ジョージア工科大学とフェイスブックのAI研究チームの研究者は、自然言語処理と強化学習の手法を組み合わせるアプローチで研究を進めている。強化学習は、与えられた目的を達成するためにどのように行動すべきかを機械学習モデルに学ばせるための手法である。これらの分野はどちらも過去2、3年の間に大幅な進歩が見られたが、2つを相互に作用させることは、これまでほとんどなかった。

このアプローチを試すために、研究チームはシステムを、テキストを基本にしたマルチプレイヤー・ゲーム「LIGHT(ライト)」で訓練した。ライトは、フェイスブックが昨年、人間とAIプレーヤーとのコミュニケーションを研究するために開発したゲームである。ゲームは、ファンタジーがテーマとして設定された世界であり、クラウドソーシングによる数千のオブジェクト、キャラクター、場所で満たされている。これらは画面上のテキストで記述されており、相互に関係し合う。プレーヤー(人間、またはコンピューター)は、「魔法使いを抱きしめる」「ドラゴンを殴る」「帽子を脱ぐ」などコマンドを入力して行動する。プレーヤーは、チャットボットが制御するキャラクターに話しかけることもできる。

何かをする理由をAIに与えるために、研究者はオリジナル版のライトには含まれていない、クラウドソーシングによる約7500の探究課題を加えた。研究チームは最終的に、ゲームの世界やキャラクター間の関係についての常識的な情報をAIに与えるナレッジ・グラフ(主語-動詞-目的語の関係についてのデータベース)も作成した。例えば、商人は友人である場合のみ、番人を信用するという原則などである。ゲームには、目的(「これまでにドラゴンが獲得した最大の秘密の財宝を築く」など)を達成するために取るべき行動(「山へ行く」、「騎士を食べる」など)も含まれていた。

研究チームはこれらすべてをまとめ、言語だけを使って目的を達成するようAIを訓練した。行動を起こすためには、その行動用のコマンドを入力するか、他のキャラクターに話しかけて同じ目的を果たすことができる。例えばAIは、剣が必要なら、それを盗むか、他のキャラクターに剣を渡してくれるよう説得するかを選択できる。

今のところ、システムはおもちゃにすぎない。無作法な態度をとることもある。バケツが必要なときに、単純に「そのバケツをくれよ、でないとおまえを猫に食わせるぞ!」と言うことがある。しかし、自然言語処理と強化学習の組み合わせは、議論や説得ができるより良いチャットボットだけでなく、言語に満ちた私たちの世界がどのように成り立っているかをさらに深く理解しているチャットボットにつながるかもしれない。わくわくするような一歩だ。

人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Corruption is sending shock waves through China’s chipmaking industry 中国の半導体産業に激震、国有ファンド幹部逮捕で投資方針見直しか
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
  5. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
ウィル・ダグラス・ヘブン [Will Douglas Heaven]米国版 AI担当上級編集者
AI担当上級編集者として、新研究や新トレンド、その背後にいる人々を取材しています。前職では、テクノロジーと政治に関するBBCのWebサイト「フューチャー・ナウ(Future Now)」の創刊編集長、ニュー・サイエンティスト(New Scientist)誌のテクノロジー統括編集長を務めていました。インペリアル・カレッジ・ロンドンでコンピュータサイエンスの博士号を取得しており、ロボット制御についての知識があります。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. A million-word novel got censored before it was even shared. Now Chinese users want answers. 「この原稿は違法です」中国のワープロソフト、未公開小説をロック
  2. Corruption is sending shock waves through China’s chipmaking industry 中国の半導体産業に激震、国有ファンド幹部逮捕で投資方針見直しか
  3. Homophobic misinformation is making it harder to contain the spread of monkeypox 「サル痘」感染拡大でまた陰謀論、同性愛嫌悪の誤情報も拡散
  4. OpenAI is ready to sell DALL-E to its first million customers オープンAI、文章から画像を描く「DALL-E2」を100万人に提供
  5. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
MITテクノロジーレビュー[日本版] Vol.7
MITテクノロジーレビュー[日本版] Vol.7世界を変える10大技術 2022年版

パンデミック収束の切り札として期待される「新型コロナウイルス感染症(COVID-19)飲み薬」、アルファ碁の開発企業が作った「タンパク質構造予測AI」、究極のエネルギー技術として期待が高まる「実用的な核融合炉」など、2022年に最も注目すべきテクノロジー・トレンドを一挙解説。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る