AIが書いた文章をほぼ確実に見破る「電子透かし」技術

メリーランド大学の研究チームは、AIが書いた文章を見分ける「電子透かしアルゴリズム」を開発し、オープンソース言語モデルに実装して有効性を確認した。盗作の検出やネット上のボット対策に利用できるかもしれない。 by Melissa Heikkilä2023.02.07

人工知能（AI）が生成したテキストに埋め込まれた隠されたパターンが、そのテキストがAIによって書かれたかどうかを見分けるのに役立つかもしれない。自分が読んでいる文章が果たして人間によって書かれたものなのかどうかを判断できるようになるのだ。

この「電子透かし」は、人間の目には見えないが、コンピューターに読み込ませることで、その文章がAIシステムの生成物である可能性を検出できる。大規模言語モデルに電子透かしが組み込まれれば、言語モデルがすでに引き起こしている問題を防げる可能性がある。

例えば、オープンAI（OpenAI）のチャットボット「チャットGPT（ChatGPT）」は2022年11月に公開されて以来、すでに学生らによって小論文の代筆に悪用されている。ニュースサイト「CNET」はAIを記事の執筆に使用したものの、盗作の非難を受けたあげく、訂正記事を出す羽目になった。しかし、AIが生成した文章を見破る有望な方法がある。そうした文章を識別できるような隠されたパターンを、リリース前のAIシステムに埋め込んでおくことだ。

すでにいくつかの研究で、こうした電子透かしを目印として、AIが生成した文章をほぼ確実に識別できることが示されている。メリーランド大学の研究チームが開発した電子透かしは、彼らが構築した検出アルゴリズムにかけることで、メタのオープンソース言語モデル「OPT-6.7B」が作成した文章を判別できた。この研究成果は、まだ査読を受けていない論文に記載されており、2023年2月15日頃にコードが無償公開される予定だ。

AI言語モデルは作動中、一度につき一つの単語を予測・生成する。メリーランド大学の研究チームの電子透かしアルゴリズムは、それぞれの単語に続く言語モデルの語彙を「グリーンリスト」と「レッドリスト」にランダムに分類し、グリーンリストにある単語を選択するよう言語 …

こちらは有料会員限定の記事です。 有料会員になると制限なしにご利用いただけます。

有料会員にはメリットがいっぱい！

毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
重要テーマが押さえられる。
各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。

人気の記事ランキング

MITテクノロジーレビューが選んだ、世界を変える10大技術: MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。
特集ページへ

AI革命の真実　誇大宣伝の先にあるもの: AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。
特集ページへ