KADOKAWA Technology Review
×
チャットGPTに最初の試練、GDPRの高いハードル
Stephanie Arnett/MITTR
知性を宿す機械 無料会員限定
OpenAI’s hunger for data is coming back to bite it

チャットGPTに最初の試練、GDPRの高いハードル

オープンAIのチャットGPT(ChatGPT)が扱うデータをめぐって、欧州のデータ保護当局が動き出した。現状ではGDPRに準拠することは困難との見方もある。 by Melissa Heikkilä2023.04.21

チャットGPT(ChatGPT)がイタリアで一時的に遮断され、他の欧州連合(EU)諸国でも多くの調査を受けたことで、オープンAI(OpenAI)は1週間余りで欧州のデータ保護法を遵守する体制を整える必要がある。できなければ、多額の罰金を科されたり、データの削除を余儀なくされたり、あるいは遮断されたりする可能性もある。

しかし専門家は、MITテクノロジーレビューに対し、オープンAIがこの規則を遵守することは不可能に近いだろうと述べている。というのも、AIモデルの訓練に使用されるデータは、インターネット上のコンテンツを無差別にスクレイピングするという、ずさんな方法で収集されているからだ。

AI開発においては、訓練データは多ければ多いほど良いというパラダイムが支配的だ。オープンAIの大規模言語モデル「GPT-2」では、40ギガバイトのテキストで構成されるデータセットが使われた。チャットGPTのベースとなったGPT-3の場合は、570ギガバイトだ。オープンAIは、最新モデルGPT-4のデータセットの規模を明らかにしていない。

しかし、オープンAIのそうしたより規模の大きなモデルを求める貪欲さが、今では仇となっている。ここ数週間で欧米のデータ保護当局は、オープンAIがチャットGPTの訓練のために使うデータの収集・処理方法について調査を開始した。当局は、オープンAIがユーザーの名前やメールアドレスといった個人データをスクレイピングし、同意なしに使用していると見ている。

イタリアのデータ保護当局は予防措置としてチャットGPTの使用を禁じ、フランス、ドイツ、アイルランド、カナダの当局も、オープンAIのシステムがどのようにデータを収集し、使用しているかを調査している。また、欧州各地のデータ保護当局を統括する組織、欧州データ保護会議(EDPB)は、チャットGPTに関する調査や法の執行を調整するために、EU全体でタスクフォースを立ち上げている。

イタリアはオープンAIに対し、4月30日までに法律を遵守するよう求めている。つまりオープンAIは、データを収集するためにユーザーの同意を求めるようにするか、データ収集に「正当な利益(legitimate interest)」があることを証明しなければならない。また、オープンAIはチャットGPTがユーザーのデータをどのように使っているのかを説明する必要がある。さらに、チャットGPTが出力したユーザーに関する情報の誤りを訂正し、ユーザーが希望する場合は自身に関するデータを消去し、コンピューター・プログラムによるそのデータの利用を拒否する権限をユーザーに与えなければならない。

もしオープンAIが、データの使用慣行が合法であることを当局に納得させられなければ、特定の国、あるいはEU全体で(チャットGPTが)遮断される可能性がある。フランスのデータ保護機関CNILのアレク …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
生成AI革命

自然な文章を生成するチャットGPT(ChatGPT)/GPT-4などの大規模言語モデル、テキストから画像を生成できるDALL·E 、Stable Diffusion、Midjourneyなどの拡散モデルの登場は、私たちの生活やビジネスを大きく変えようとしている。
人工知能(AI)の新時代を牽引する「生成AI(ジェネレーティブAI)」革命の最前線を追う。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る