KADOKAWA Technology Review
×
Facebookログイン終了のお知らせ(2026/3/31 予定)
「非倫理的」なAI訓練データセット、削除するだけでは不十分
Ms Tech | Pixabay
人工知能(AI) 無料会員限定
Deleting unethical data sets isn’t good enough

「非倫理的」なAI訓練データセット、削除するだけでは不十分

人工知能(AI)の訓練用にはかつて、ネット上のデータを許可なく集められたものが使われた。後に批判され、データセットを撤回する例が相次いだがが、撤回するだけでは問題の解決にはならない。 by Karen Hao2021.08.23

2016年、マイクロソフトは、顔認識の進歩に拍車をかけることを期待して、世界最大の顔データベースを公開した。「MS-Celeb-1M」と呼ぶこのデータベースには、10万人の有名人の顔を撮影した1000万枚の画像が入っていた。しかし「有名人」といっても、その定義は曖昧なものだった。

3年後、研究者のアダム・ハーベイ(Adam Harvey)とジュール・ラプラス(Jules LaPlace)がこのデータセットを精査したところ、ジャーナリスト、アーティスト、活動家、学者など、仕事のためにネット上で活動している多くの一般人が見つかった。彼らはみな、データベースへの収録に同意していなかったが、彼らの顔写真は「MS-Celeb-1M」データベースにとどまらず、その向こう側へと渡ってしまった。大量の顔写真を集めたこのデータベースは、フェイスブック、IBM、バイドゥ、そして中国最大級の顔認識技術大手で、中国警察にシステムを販売しているセンスタイム(SenseTime)などの企業が研究に利用していた。

ハーベイとラプラスの調査から間もなく、ジャーナリストからの批判を受けたマイクロソフトは、「研究は終了した」とだけ述べてデータセットを削除した。しかし、この事件がもたらしたプライバシーに関する懸念は、インターネット上の永遠の地に残っている。さらに、問題はこのケースだけではない。

かつて、Web上の画像やテキストをスクレイピングすることは、現実世界のデータを収集する先進的な手法と考えられていた。しかし今では、GDPR(欧州データ保護規則)などの法律や、データ・プライバシーや監視に対して社会の懸念が高まったことにより、この行為は法的にもリスクが高く、不適切なものになっている。その結果、人工知能(AI)研究者らは、スクレイピングによって作成したデータセットを撤回することが多くなった。

しかし、新しい研究によれば、一旦作成し、公開したデータセットを撤回しても、問題のあるデータの拡散や不正利用を防ぐ効果はほとんどないという。この研究チームは、顔写真や人物画像を含むデータセットのうち最もよく引用されているものを3つ(うち2つは撤回されたもの)選び、それぞれが1000本近い論文でどのようにコピーされ、使用され、別の目的で再利用されたかを追跡した。

「MS-Celeb-1M」の場合、コピーされたデータが第三者のサイトや、オリジナルの上に構築された派生データセットに残存していた。このデータで事前に学習させたオープンソースのモデルも容易に入手できる。さらに、このデータセットとその派生物は、撤回後6カ月から18カ月の間に発表された数百本の論文で引用されている。

デュー …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. Promotion Emerging Technology Nite #36 Special 【3/9開催】2026年版「新規事業の発想と作り方」開催のお知らせ
  2. EVs could be cheaper to own than gas cars in Africa by 2040 アフリカでEVがガソリン車より安くなる日——鍵は「太陽光オフグリッド」
  3. RFK Jr. follows a carnivore diet. That doesn’t mean you should. 「肉か発酵食品しか食べない」米保健長官が目指す「健康な米国」
  4. Why EVs are gaining ground in Africa アフリカ初のバッテリー工場も建設中、「次のEV市場」は立ち上がるか?
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る