
何でもやってくれる
AIエージェントに
あなたは「鍵」を渡せますか
旅行の予約、メールの整理、プログラムの作成──AIエージェントが人間の秘書や助手として活躍し始めた。しかし指示を誤解して想定外の行動を取ったり、ハッカーに悪用される危険性、さらには職への影響も懸念される。次に起こることへの備えはできているのだろうか。 by Grace Huckins2025.06.17
- この記事の3つのポイント
-
- AIエージェントが人間に代わって現実世界で自律的に行動する時代が到来
- 指示の誤解釈や悪用リスクで「人類を賭けたロシアンルーレット」状態
- 労働市場の大変動と権力者への過度な権力集中も懸念される
米国東部時間2010年5月6日午後2時32分。米国株式市場からわずか20分足らずで1兆ドル近くが消滅した。当時史上最速の株価急落だった。その直後、ほぼ同時に市場は反発した。
数カ月にわたる調査の後、規制当局は、この「瞬間暴落(フラッシュ・クラッシュ)」の責任の大部分は、超高速取引(HFT)アルゴリズムにあると結論付けた。市場における収益機会をその優れたスピードで利用して金儲けする、取引アルゴリズムである。それらのシステムが暴落の最初のきっかけとなったわけではなかったが、株価下落に拍車をかける強力な役割を果たした。価格が下がり始めたとき、システムがすばやく資産の売却を開始したのだ。その後、株価の下落スピードが一層増すと、自動化されたトレーダーたちはさらに売りを増やし、暴落は雪だるま式に拡大した。
この瞬間暴落はおそらく、エージェント(人間の監視なしに現実世界で行動を起こす能力を持つ自動化されたシステム)が引き起こす危険の最もよく知られた例だろう。その能力こそが、エージェントの価値の源泉である。たとえば、瞬間暴落を加速させたエージェントは、人間よりもはるかに速く取引することがが可能だった。しかし、そのような能力を持つ故に、エージェントは非常に多くの害を引き起こす可能性がある。「エージェントには大きなパラドックスがあります。つまり、エージェントを有用なもの、あるいはさまざまなタスクを達成可能なものにしている要素には、コントロールを手放すということも含まれているのです」。AI倫理を専門とするグーグル・ディープマインド(Google DeepMind)の上級研究科学者、イアソン・ガブリエルは言う。
エージェントはすでにあらゆる場所に存在している。そして、何十年も前から存在した。たとえば、サーモスタット(温度調整装置)もエージェントだ。自動的に暖房の電源をオン/オフして、家を特定の温度に保っている。ウイルス対策ソフトや掃除機のルンバもそうだ。市場の状況に応じて売買するようにプログラムされている超高速取引システムと同様に、それらのエージェントはすべて、あらかじめ決められたルールに従って特定のタスクを実行するように作られている。Siri(シリ)や自動運転車のようなより高度なエージェントでさえ、その行動の多くを実行する際は、あらかじめ書かれたルールに従う。
しかしここ数カ月の間に、新しい種類のエージェントが登場した。大規模言語モデル(LLM)を使って構築されたエージェントだ。オープンAIのエージェント「Operator(オペレーター)」は、自律的にWebブラウザーを操作して食料品を注文したり、レストランの予約をしたりできる。「Claude Code(クロード・コード)」や、「Cursor(カーソル)」のチャット機能のようなシステムは、1つのコマンドでコードベース全体を修正できる。中国のスタートアップ企業バタフライ・エフェクト(Butterfly Effect)の話題のエージェント「Manus(マヌス)」は、人間の監督をほとんど受けずにWebサイトを構築・展開できる。テキストのコマンドを使ってビデオゲームをプレイすることから、ソーシャルメディア・アカウントの運用まで、テキストで表現できるあらゆるアクションが、この種のシステムの守備範囲内に入る可能性があるわけだ。
LLMエージェントはまだあまり実績はないものの、開発企業のCEOたちの話によれば、経済を変革することになるだろう。しかも、早い時期に、だ。オープンAI(OpenAI)のサム・アルトマンCEOは、エージェントが今年にも「労働力に加わる」かもしれないと述べている。セールスフォースのマーク・ベニオフCEOは、企業がエージェントを自社独自の目的に合わせてカスタマイズできるようにするプラットフォーム「Agentforce(エージェントフォース)」を積極的に宣伝している。米国防総省は最近、軍用エージェントの設計とテストのため、スケールAI(Scale AI)と契約を結んだ。
学者たちもまた、エージェントのことを真剣に受け止めている。「エージェントは次のフロンティアです」。こう話すのは、カリフォルニア大学バークレー校の電気工学・コンピューター科学教授であるドーン・ソングだ。しかしソング教授は、「私たちがAIから本当に恩恵を受け、実際に(AIを使って)複雑な問題を解決するためには、AIを安全かつセキュアに機能させる方法を考え出す必要があります」とも言う。
それは難しい課題だ。チャットボットLLMと同様に、エージェントは無秩序で予測不可能なものになり得る。近い将来、あなたの銀行口座にアクセスできるエージェントが、予算管理を助けてくれるかもしれない。しかし、あなたの貯金をすべて使ってしまったり、あなたの情報をハッカーに漏らしてしまったりする可能性もある。あなたのソーシャルメディア・アカウントを管理するエージェントが、ネット上の存在感を維持するための労力をいくらか軽減してくれるかもしれないが、デマを広めたり、他のユーザーを罵倒したりする恐れもある。
いわゆる「AIのゴッドファーザー」の1人に数えられるモントリオール大学のコンピューター科学教授、ヨシュア・ベンジオも、そのようなリスクを懸念する1人だ。しかし、ベンジオ教授が最も懸念しているのは、LLMが自分自身の優先順位や意思を発展させ、それらに基づき、現実世界における能力を使って行動するようになる可能性である。チャット・ウィンドウの中に閉じ込められたLLMは、人間の助けなしに大したことはできない。しかし、強力なAIエージェントは、自分自身を複製したり、安全措置を乗り越えたり、シャットダウンされるのを防いだりできる可能性がある。そこから、やりたいことを何でもするようになるかもしれないのだ。
今のところ、エージェントが開発者の意図通りに動作することを保証したり、悪意のある行為者がエージェントを悪用するのを防いだりするための確実な方法はない。ベンジオ教授のような研究者たちが、新しい安全メカニズムを開発しようと懸命に努力しているものの、エージェントの能力の急速な拡大には追いつけないかもしれない。「エージェントシステムの構築において私たちがこのまま現在の道を歩み続けるとすれば、それは基本的に、人類を賭けてロシアンルーレットをしているようなものです」。ベンジオ教授は言う。
LLMを現実世界で行動させるのは、驚くほど簡単だ。必要なのは、LLMを「ツール」、つまりテキストの出力を現実世界の行動に変換できるシステムに接続し、そのツールの使い方をモデルに指示することだけである。定義はさまざまではあるが、本当の意味で非エージェント的なLLMは、ますます珍しいものになりつつある。例えば、特に人気のあるモデル(ChatGPT、Claude、Gemini)はすべて、Web検索ツールを使って質問の答えを見つけることができる。
しかし、「弱いLLM」は、効果的なエージェントにならない。エージェントが有用な仕事をするためには、ユーザーから抽象的な目標を受け取り、その目標を達成するための計画を立て、ツールを使ってその計画を実行できる必要がある。そのため、推論型(reasoning)LLMは、エージェントを構築するための出発点として特に適している。問題解決の過程で追加的なテキストを生成して「自分自身に語りかける」ことで、自らの応答について「考える」LLMである。
LLMにファイルのような何らかの形の長期記憶手段を与え、重要な情報を記録したり、多段階の計画を追跡したりできるようにすることも重要である。モデルに自分がどれくらいうまくやれているか教えることも、同様に重要だ。それには、LLMに自分が環境に加えた変化を見させたり、自らがタスクで成功しているのか、それとも失敗しているのか明示的に教えたりすることが必要かもしれない。
そのようなシステムはすでに、チャリティのための募金やビデオゲームのプレイにおいて、やり方の明示的な指 …
- 人気の記事ランキング
-
- Inside the tedious effort to tally AI’s energy appetite 動画生成は別次元、思ったより深刻だったAIの電力問題
- Promotion Call for entries for Innovators Under 35 Japan 2025 「Innovators Under 35 Japan」2025年度候補者募集のお知らせ
- IBM aims to build the world’s first large-scale, error-corrected quantum computer by 2028 IBM、世界初の大規模誤り訂正量子コンピューター 28年実現へ
- What’s next for AI and math 数学オリンピックで「人間超え」のAIは数学者になれるか?
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法