AIが書いた文章をほぼ確実に見破る「電子透かし」技術
メリーランド大学の研究チームは、AIが書いた文章を見分ける「電子透かしアルゴリズム」を開発し、オープンソース言語モデルに実装して有効性を確認した。盗作の検出やネット上のボット対策に利用できるかもしれない。 by Melissa Heikkilä2023.02.07
人工知能(AI)が生成したテキストに埋め込まれた隠されたパターンが、そのテキストがAIによって書かれたかどうかを見分けるのに役立つかもしれない。自分が読んでいる文章が果たして人間によって書かれたものなのかどうかを判断できるようになるのだ。
この「電子透かし」は、人間の目には見えないが、コンピューターに読み込ませることで、その文章がAIシステムの生成物である可能性を検出できる。大規模言語モデルに電子透かしが組み込まれれば、言語モデルがすでに引き起こしている問題を防げる可能性がある。
例えば、オープンAI(OpenAI)のチャットボット「チャットGPT(ChatGPT)」は2022年11月に公開されて以来、すでに学生らによって小論文の代筆に悪用されている。ニュースサイト「CNET」はAIを記事の執筆に使用したものの、盗作の非難を受けたあげく、訂正記事を出す羽目になった。しかし、AIが生成した文章を見破る有望な方法がある。そうした文章を識別できるような隠されたパターンを、リリース前のAIシステムに埋め込んでおくことだ。
すでにいくつかの研究で、こうした電子透かしを目印として、AIが生成した文章をほぼ確実に識別できることが示されている。メリーランド大学の研究チームが開発した電子透かしは、彼らが構築した検出アルゴリズムにかけることで、メタのオープンソース言語モデル「OPT-6.7B」が作成した文章を判別できた。この研究成果は、まだ査読を受けていない論文に記載されており、2023年2月15日頃にコードが無償公開される予定だ。
AI言語モデルは作動中、一度につき一つの単語を予測・生成する。メリーランド大学の研究チームの電子透かしアルゴリズムは、それぞれの単語に続く言語モデルの語彙を「グリーンリスト」と「レッドリスト」にランダムに分類し、グリーンリストにある単語を選択するよう言語 …
- 人気の記事ランキング
-
- Stratospheric internet could finally start taking off this year グーグルもメタも失敗した 「成層圏ネット」再挑戦、 2026年に日本で実証実験
- Promotion Emerging Technology Nite #36 Special 【3/9開催】2026年版「新規事業の発想と作り方」開催のお知らせ
- The first human test of a rejuvenation method will begin “shortly” ハーバード大教授主導の 「若返り治療」初の試験へ、 イーロン・マスクも関心
- Microbes could extract the metal needed for cleantech 微生物で「老朽鉱山」再生、バイオマイニングは金属需要に間に合うか
- What’s next for EV batteries in 2026 米国後退、加速する中国支配 EVバッテリー市場、 2026年はどう動く?
