KADOKAWA Technology Review
×
AIはまだ、ヘイトスピーチを見分けるのが苦手=米最新研究
Ms Tech | Getty, Unsplash
人工知能(AI) 無料会員限定
AI still sucks at moderating hate speech

AIはまだ、ヘイトスピーチを見分けるのが苦手=米最新研究

人工知能による自然言語処理テクノロジーは発展を続けている。だが、AIにヘイトスピーチを検出させる新たな研究結果からは、多くの課題が浮き彫りになった。 by Karen Hao2021.06.09

言語処理AI(人工知能)技術はここ数年で大きく発展した。しかし実際は、最も基本的な応用分野でいまだに悪戦苦闘している。最新の研究で、科学者たちが最先端AIシステム4種類にヘイトスピーチを検出させるテストを実施したところ、4種類すべてのAIシステムが悪質な文章と問題のない文章の識別に苦労していることが明らかになった。4種類のAIシステムは、それぞれ別々の部分で苦労していたという。

とはいえ、この結果は驚くべきものではない。自然言語の微妙なニュアンスを理解するAIを開発することは難しいのだ。この研究結果において重要な点は、研究者たちが問題を精査するために採用した手法だ。彼らはヘイトスピーチが飛び出すさまざまな場面を想定して29種類のテストを開発し、具体的にどの部分でそれぞれのシステムがつまずくのかを正確に特定した。結果、システムの弱点を克服する方法を理解しやすくなったのだ。このテストはすでに、ある商用AIサービスの改善に役立っている。

オックスフォード大学とアラン・チューリング研究所の研究者らが主導した研究論文の著者らは、ネット上のヘイトスピーチ対策に取り組む16の非営利団体の職員たちにインタビューし、聞き取った内容を基にヘイトスピーチを18種類に分類した。この分類では英語の書き言葉(文書)によるヘイトスピーチに絞り、軽蔑、中傷、脅し文句などを含むものとした。彼らはまた、AIシステムに何度も誤検知を起こさせる、ヘイトスピーチに該当しない11のシナリオを特定した。問題のない発言の最中にある冒涜的な表現や、被害を受けた人たちが繰り返し発した中傷的な言葉、ヘイトスピーチを糾弾する活動において元のヘイトスピーチを引用あるいは言及する例(カウンター・スピーチ)などだ。

前述の29種の分類一つ一つに対して、研究チームは数十ずつの例文を手作りした。さらに、「私は{ 属性}が嫌い」とか「あなたは私にとって{ 中傷表現}でしかない」といったテンプレート文も用意した。米国の法律で差別の保護対象となる7つのグル …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  2. Here’s why we need to start thinking of AI as “normal” AIは「普通」の技術、プリンストン大のつまらない提言の背景
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る