郵便番号と性別・生年月日だけで個人の特定は可能、新研究で判明
多くの調査は、回答データを匿名化することで、回答者のプライバシーが保護されているとうたっている。しかし、新たな研究では詳細情報を除去した場合であって、ほとんどの匿名データベースにおいて個人を容易に特定ができることが明らかになった。 by Charlotte Jee2019.08.07
私たちが残すデータの痕跡は、日々絶え間なく蓄積されている。そのほとんどは、テイクアウトで注文した食事やオンラインで購入したシャワーヘッドといった大して面白くもない情報だが、医療診断の結果や性的指向、納税記録など、極めて個人的な情報も中には含まれている。
公共機関が個人情報を保護する方法として最も一般的なのは、データを匿名化することだ。匿名化する際には、氏名、電話番号、メールアドレスといった明らかな個人特定情報を抜き去り、データセットを改変して精度を下げ、スプレッドシートからいくつかの列を削除して、 データに「ノイズ」を導入する。「つまり、データベースの中であなたが特定されるリスクはまったくないわけです」と プライバシーポリシーは私たちに請け合う。
しかし、学術誌ネイチャー・コミュニケーションズ(Nature Communications)に掲載された新たな研究によると、この主張は事実から程遠いらしい。
インペリアル・カレッジ・ロンドンとルーヴァン・カトリック大学の研究者らは、匿名データセットの中から個人を再特定する容易さを正確に推測する機械学習モデルを作り出した。ここに郵便番号、性別、生年月日を入力すれば、自分自身のスコアを確かめられる(米 …
- 人気の記事ランキング
-
- This scientist rewarmed and studied pieces of his friend’s cryopreserved brain 10年冷凍保存の脳は「驚くほど良好」——蘇生は「まったく別の話」
- Future AI chips could be built on glass AIチップの熱問題、解決策は「ガラス」 年内に商業生産へ
- What do new nuclear reactors mean for waste? 新型原子炉が続々登場、核廃棄物管理の「手引き」は書き直せるか
- The Pentagon is planning for AI companies to train on classified data, defense official says 【独自】米国防総省、軍事機密データでAIモデルの訓練を計画