KADOKAWA Technology Review
×
予測できない「AIの欺瞞」、機械がたどり着いた不可解な行動の理由
Stephanie Arnett/MITTR
人工知能(AI) 無料会員限定
AI systems are getting better at tricking us

予測できない「AIの欺瞞」、機械がたどり着いた不可解な行動の理由

人工知能(AI)がさまざまなケースで、人間が訓練したわけでもないのに、「欺瞞」を実行することをまとめた研究が発表された。しかしAIは決して、人間を欺こうとしているわけではない。人間が設定した目標を、より上手く達成しようとしているだけなのだ。 by Rhiannon Williams2024.05.14

人工知能(AI)システムが明示的に訓練されない方法で人間を「欺く」事例が相次いでいる。自分の行動に関する虚偽の説明をしたり、戦略的な目的を達成するために人間のユーザーから真実を隠して誤った方向に導いたりするのだ。

パターンズ(Patterns)誌に2024年5月10日付けで掲載された、過去研究をまとめたレビュー論文は、これらの事例から「AIの制御は非常に困難であり、AIシステムは予測不能な行動をとる」ことを浮き彫りにしている。

人間を欺くということは、AIモデルに意思があることを示唆していると思われるかもしれない。AIモデルには意思はない。しかし、AIモデルは与えられた目標を達成するため、無意識のうちに障害を回避する方法を見つけようとする。こうした回避策が、ユーザーの期待に反し、欺瞞だと受け取られることがある。

AIシステムが欺瞞を学習した分野のひとつは、勝つように訓練されたゲームコンテキストだ。特に戦略的行動が要求されるゲームの場合、この傾向が顕著となる。

2022年11月、メタは「キケロ(Cicero)」というAIを開発したと発表した。キケロは、欧州の覇権争いで同盟交渉をする人気の軍事戦略ゲーム「ディプロマシー(Diplomacy)」のオンライン版で人間に勝つことができる。

メタの研究者によると、キケロは非常に正直で有用なAIとなるよう、データセットの「誠実」なサブセットを用いて訓練されているため、成功のために同盟国を 「意図的に裏切ることはない」。しかし、新たな論文の著者は、真実はその逆だと主張する。つまり、キケロは契約を破り、あからさまな嘘をつき、計画的な欺瞞を実行したというのだ。メタはキケロが正直に行動するよう訓練しようとしたが、これに失敗したことで、「AIシステムは予想に反して人間を欺く方法を学習できる」ことが示されたと著者は述べている。

メタは、キケロが人を欺く行 …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. How do our bodies remember? 解説:運動をやめても筋肉は覚えている——復帰が速い科学的理由とは
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
気候テック企業10 2025

MITテクノロジーレビューは毎年、気候テック分野で注目すべき企業を選出し、その一覧を発表している。 新たなクリーン・エネルギー源の創出や、食品生産・物流の再構築といった形で経済の主要セクターの脱炭素化に取り組む注目企業10社を紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る