
AI訓練データに個人情報、 身分証や履歴書など数百万件
生成AIモデルの訓練に使用される最大規模のオープンソースデータセットの1つに、個人を特定可能な機密情報が多数発見された。Webスクレイピングによって収集されたこれらのデータは、AIモデルに取り込まれて、プライバシーの侵害につながる恐れがある。
by Eileen Guo本日の重要ニュースをご案内。
07.23生成AIモデルの訓練に使用される最大規模のオープンソースデータセットの1つに、個人を特定可能な機密情報が多数発見された。Webスクレイピングによって収集されたこれらのデータは、AIモデルに取り込まれて、プライバシーの侵害につながる恐れがある。
by Eileen Guo