KADOKAWA Technology Review
×
Innovators Under 35 Japan 2026 候補者募集開始!
AIチャットボット向け「うそ発見器」、LLMの幻覚見抜く
Stephanie Arnett/MITTR | iStock, Envato
人工知能(AI) 無料会員限定
Chatbot answers are all made up. This new tool helps you figure out which ones to trust.

AIチャットボット向け「うそ発見器」、LLMの幻覚見抜く

チャットGPTのような大規模言語モデルを企業で利用する際に問題となるのが、ハルシネーション(幻覚)だ。MIT発のスタートアップは、モデルの回答がどの程度信頼できるかを示すツールを開発した。 by Will Douglas Heaven2024.05.01

大規模言語モデル(LLM)は、でっち上げの能力で有名だ。実際、それがいちばんの得意技である。大規模言語モデル自体に事実とフィクションを区別する能力はないため、リスクを負ってまで利用する価値があるだろうかと迷っている企業は多い。

マサチューセッツ工科大学(MIT)の量子コンピューティング研究室からスピンアウトした人工知能(AI)スタートアップ企業、クリーンラボ(Cleanlab)が開発した新ツールは、大規模言語モデルの現実の信頼性のレベルを、できるだけ明確に把握できるように設計されている。同社の「トラストワージー・ランゲージモデル(TLM:Trustworthy Language Model)」は、大規模言語モデルが生成した出力に対して、その内容の信頼性の高低に応じて0から1までのスコアを出してくれる。ユーザーはこの数値を見て、信じていい回答と捨てるべき回答を選択できる。つまり、チャットボット用うそ発見器だ。

このツールを使うことで、捏造ぶりを懸念する企業も大規模言語モデルの活用を検討するようになってほしい、とクリーンラボは期待している。「大規模言語モデルで世界が変わることは誰でも分かっていると思います。ただ、ハルシネーション(幻覚)がネックになっているのです」と、クリーンラボのカーティス・ノースカットCEOは言う。

人間がコンピューター上で情報を検索する方法として、チャットボットは急速に主流になりつつある。検索エンジンも、チャットボットのテクノロジーを念頭に設計し直されている。毎日数十億人が、学校の課題からマーケティング用コピー、財務報告書に至るまであらゆる書類の作成に使用しているオフィスソフトウェアにも、最近ではチャットボットが組み込まれている。だが、元グーグル社員が立ち上げたスタートアップ企業、ベクタラ(Vectara)が2023年11月に発表した研究報告によると、チャットボットは少なくとも3%の確率で情報を捏造することが分かった。そのくらいなら、と言われるかもしれないが、多くの企業にとっては許容できない誤りかもしれない。

クリーンラボのツールは、企業間紛争と調査が専門の英国のコンサルタント会社、バークレーリサーチグループ(Berkeley Research Group)など数社ですでに採用されている。バークレーリサーチグループのスティーブン・ゴーソープは、これまでに見られたようなハルシネーションの問題に対して実効性があるソリューションは、TLMが初めてだと言う。「クリーンラボのTLMは、数千人のデータ科学者の仕事に匹敵します」。

2021年、クリーンラボは、機械学習アルゴリズムの訓練に使われる34の一般的なデータセットのエラーを検出するテクノロジーを開発した。同データを用いて訓練したさまざまなモデルの出力の差分を測定する仕組みである。このテクノロジーはすでに、グーグル、テスラ(Tesla)、銀行大手チェース(Chase)をはじめ、複数の大企業で使用されている。TLMも、基本的には、モデル間の不一致をシステム全体の信頼性の尺度として使えるという同じ発想をチャットボットに適用したものだ。

MITテクノロジーレビューが先日、クリーンラボにデモを …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. It’s time to address the looming crisis in entry-level work. 「コーディングを学べ」もう通用せず、AIが若者の雇用を奪い始めた
  2. Promotion Call for entries for Innovators Under 35 Japan 2026 「Innovators Under 35 Japan」2026年度候補者募集のお知らせ
  3. Anthropic’s Code with Claude showed off coding’s future—whether you like it or not 「Claudeに任せてしまおう」 たった1年で激変したソフトウェア開発
▼Promotion
社会実装都市「ひろしま」の魅力に迫る ローカル ✕ イノベーション
MITテクノロジーレビューが選んだ、AIの10大潮流 [2026年版]

AIをめぐる喧騒の中で、本当に目を向けるべきものは何か。この問いに対する答えとして、MITテクノロジーレビューはAIの重要なアイデア、潮流、新たな進展を整理したリストを発表する。

特集ページへ
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る