強化学習AIに脆弱性、誤動作を引き起こす敵対的攻撃の新手法
ゲームプレイや自動運転など最先端の人工知能(AI)で使われている強化学習に、深刻な脆弱性が発見された。強化学習を使って訓練されたAIは、相手の奇妙な行動によってだまされる可能性があるというのだ。 by Will Douglas Heaven2020.03.10
サッカー・ボットがゴールを狙おうとする。しかし、ゴールキーパーは、シュートをブロックする準備をする代わりに、地面に倒れて足をクネクネさせ始める。 するとストライカーは混乱して奇妙な横向きの小躍りをし、足をジタバタさせ、片方の腕を振り回して倒れこむ。ゴールキーパーの勝ちだ。
これはプロが使う戦術ではないが、深層強化学習により訓練された人工知能(AI)が、これまで考えられていたよりも攻撃に対して脆弱だということを示している。強化学習は「アルファゼロ(AlphaZero)」や「オープンAI ファイブ(OpenAI Five)」など最先端のゲームプレイAIで使用されている技術であり、こうした脆弱性は深刻な結果をもたらす可能性がある。
過去数年間で研究者は、教師つき学習と呼ばれるラベル付きデータを使用して訓練されたAIをダメにする多くの方法を発見した。画像の数ピクセルを変更するなど、AIの入力にわずかな細工をするだけで完全に混乱させることが可能で、たとえばナマケモノの画像をレーシングカーと識別させることができる。こうしたいわゆる敵対的攻撃には確実な対応策はない。
教師あり学習と比較して強化学習は比較的新しい手法であり、まだあまり研究されていない。しかし、強化学習もまた、細工した入力に対して脆弱であることがわかった。強化学習ではさまざまな状況での振る舞いをAIに教えるために、正しいことをしたときに報酬を与える。 AIはやがてポリシーと呼ばれる行動計画を学習する。ポリシーはゲームをプレイするだけでなく、AIに車を運転させたり自動取引システムを実行させたりすることも可能だ。
2017年、ディープマインドに所属するサンディ・ファンらは、古典的なビデオゲーム「ポン(Pong)」をプレイするための強化学習で訓練したAIについて調べた。 そして、ビデオ入力のフレームに単一の不正ピクセルを追加す …
- 人気の記事ランキング
-
- What you may have missed about GPT-5 肩透かしだったGPT-5、オープンAIの方針転換に危うさ
- Promotion MITTR Emerging Technology Nite #34 【9/10開催】伝説の玩具「アームトロン」開発者が誕生秘話を語る
- Five ways that AI is learning to improve itself 迫る「知能爆発」の兆し、 AIによるAIの進化は 5つの領域で起きている
- The greenhouse gases we’re not accounting for 見過ごされた気候フィードバック効果、温暖化が数年早まる可能性も
- It’s pretty easy to get DeepSeek to talk dirty 「お堅い」Claude、性的会話に応じやすいAIモデルは?