チャットGPTに最初の試練、GDPRの高いハードル
オープンAIのチャットGPT(ChatGPT)が扱うデータをめぐって、欧州のデータ保護当局が動き出した。現状ではGDPRに準拠することは困難との見方もある。 by Melissa Heikkilä2023.04.21
チャットGPT(ChatGPT)がイタリアで一時的に遮断され、他の欧州連合(EU)諸国でも多くの調査を受けたことで、オープンAI(OpenAI)は1週間余りで欧州のデータ保護法を遵守する体制を整える必要がある。できなければ、多額の罰金を科されたり、データの削除を余儀なくされたり、あるいは遮断されたりする可能性もある。
しかし専門家は、MITテクノロジーレビューに対し、オープンAIがこの規則を遵守することは不可能に近いだろうと述べている。というのも、AIモデルの訓練に使用されるデータは、インターネット上のコンテンツを無差別にスクレイピングするという、ずさんな方法で収集されているからだ。
AI開発においては、訓練データは多ければ多いほど良いというパラダイムが支配的だ。オープンAIの大規模言語モデル「GPT-2」では、40ギガバイトのテキストで構成されるデータセットが使われた。チャットGPTのベースとなったGPT-3の場合は、570ギガバイトだ。オープンAIは、最新モデルGPT-4のデータセットの規模を明らかにしていない。
しかし、オープンAIのそうしたより規模の大きなモデルを求める貪欲さが、今では仇となっている。ここ数週間で欧米のデータ保護当局は、オープンAIがチャットGPTの訓練のために使うデータの収集・処理方法について調査を開始した。当局は、オープンAIがユーザーの名前やメールアドレスといった個人データをスクレイピングし、同意なしに使用していると見ている。
イタリアのデータ保護当局は予防措置としてチャットGPTの使用を禁じ、フランス、ドイツ、アイルランド、カナダの当局も、オープンAIのシステムがどのようにデータを収集し、使用しているかを調査している。また、欧州各地のデータ保護当局を統括する組織、欧州データ保護会議(EDPB)は、チャットGPTに関する調査や法の執行を調整するために、EU全体でタスクフォースを立ち上げている。
イタリアはオープンAIに対し、4月30日までに法律を遵守するよう求めている。つまりオープンAIは、データを収集するためにユーザーの同意を求めるようにするか、データ収集に「正当な利益(legitimate interest)」があることを証明しなければならない。また、オープンAIはチャットGPTがユーザーのデータをどのように使っているのかを説明する必要がある。さらに、チャットGPTが出力したユーザーに関する情報の誤りを訂正し、ユーザーが希望する場合は自身に関するデータを消去し、コンピューター・プログラムによるそのデータの利用を拒否する権限をユーザーに与えなければならない。
もしオープンAIが、データの使用慣行が合法であることを当局に納得させられなければ、特定の国、あるいはEU全体で(チャットGPTが)遮断される可能性がある。フランスのデータ保護機関CNILのアレク …
- 人気の記事ランキング
-
- The winners of Innovators under 35 Japan 2024 have been announced MITTRが選ぶ、 日本発U35イノベーター 2024年版
-
Promotion
The winners of Innovators under 35 Japan 2024 have been announced
MITTRが選ぶ、
日本発U35イノベーター
2024年版 - AI will add to the e-waste problem. Here’s what we can do about it. 30年までに最大500万トン、生成AIブームで大量の電子廃棄物
- Kids are learning how to make their own little language models 作って学ぶ生成AIモデルの仕組み、MITが子ども向け新アプリ
- OpenAI brings a new web search tool to ChatGPT チャットGPTに生成AI検索、グーグルの牙城崩せるか