パンデミックを機に集約進む
米国保健医療データ
米国では国民の保健医療データがさまざまな機関によって断片的に保有されており、新型コロナウイルス感染症について研究する際の障壁となっている。しかし、最近になり、数百万人の患者データをまとめる取り組みが成果を上げつつある。 by Cat Ferguson2021.06.25
パンデミックを通じて、国民が知りたいことと、科学者が確実に言えることとの間には深刻な乖離があった。
科学者たちは、歴史上のどんな病気よりも早く新型コロナウイルス(SARS-CoV-2)の研究に取り組んだ。だが、その一方で、「新型コロナウイルス感染症(COVID-19)の症状は?」「どのように感染が広がるのか?」「どういう人が最も感染しやすいのか?」「最善の治療方法は?」といった、一見すると基本的な疑問に医師が答えられない場面があり、一般市民はショックを受けた。
国内総生産の5分の1近くを保健医療に費やしているにもかかわらず、他のどの裕福な国よりも成果が上がってない米国ほど、この乖離がはっきりしている国はない。単に科学的に難しいという理由だけではない。米国の保健医療は互換性のない古めかしいシステムの寄せ集めの上に構築されているため、答えを見つけることが一筋縄ではいかないのだ。
連邦と州、地方自治体のプライバシー保護法は重複しており、それらが互いに矛盾していることもある。その一方で医療記録は、プライバシー上の理由に加えて、非特定化された医療データの販売が非常に儲かることから、記録を所有する機関によって断片化され、極度にサイロ化されている。
こうしたサイロに閉じ込められたデータにアクセスすることが、新型コロナウイルス感染症に関する疑問に答える唯一の方法だ。米国には新型コロナウイルス感染症の患者と研究機関の両方が多数存在する。にもかかわらず、非常に多くの重要な研究が実施されてきたのは、国としての医療制度を備えた別の国々であった。新型コロナウイルスで命を落とす可能性が高まる危険因子や感染後遺症の特徴に関する最も説得力のあるデータは、主に英国から出されている。英国では、公衆衛生研究者は英国国民健康サービス(NHS)の患者の医療記録5600万件からなるデータにアクセスできる。
パンデミック初期に、米国立衛生研究所(NIH)から資金を得ている研究者グループは、データ共有の障壁を打ち破らなければ、新型コロナウイルスに関する多くの疑問に答えることは不可能であることに気づいた。そこで、秘匿性を確保しながらデータを活用できる、実際の患者の記録を機関横断的に統合する枠組みを開発した。
その成果が、「米国コビッド・コーホート共同研究(N3C:National COVID Cohort Collaborative)」だ。全国数百万人の患者の医療記録を収集して不要な情報を取り除き、人工呼吸器を使用するタイミングから、新型コロナウイルスが女性の生理に与える影響まで、あらゆる研究グループにアクセスを許可している。
「パンデミックという状況にもかかわらず、研究に使える整合性のある集計データが存在しなかったことは衝撃的です」と、オレゴン健康科学大学で医療情報学の教授を務め、N3Cの共同リーダーの1人であるメリッサ・ヘンデルは言う。「パンデミックがなかったら、この水準のデータが提供されることは決してなかったでしょうが、私たちはそれをやり遂げました。これは、臨床データを、安全かつ透明な方法で広範囲に整合性をとり、共有できるという証です」。
現在、N3Cのデータベースは、新型コロナウイルスの記録に関する世界最大級のコレクションとなっている。新型コロナウイルスに感染した210万人の医療記録をはじめとして、56の機関から患者630万人分の記録が集められ、その数は今も増加している。ほとんどの記録は2018年以降のもので、データベース構築に協力した組織は5年間データを更新し続けることを約束した。これにより、N3Cは単に現在の新型コロナウイルス感染症の研究に最も有用なリソースとなっているだけでなく、感染後遺症の研究に最も期待できる方法の1つとなった。
医療・研究機関が、中央集権的な連邦政府に大量の記録を提供することは、米国の保健医療では異例のことだ。うまく活用すれば、パンデミックのずっと後になっても細かい疑問に答えてくれる可能性がある。将来的な同様の取り組みに対する概念実証の役割も果たせるかもしれない。
オープンソース・データ
N3Cの取り組みに参加し、データベースに情報を提供する機関は、最初に「新型コロナウイルス検査で陽性となった人」と「統制群となる人」の2つの患者グループを抽出する。次に、個人の特定が可能なあらゆるデータ(郵便番号と医療サービス提供日付を除く)を取り除いて、安全を確保したうえでN3Cに送信する。送信先では技術者が、データから不要なものを取り除いて(必ずしも簡単な作業ではない)、データベースに入力する。
情報提供機関に所属しているかどうかに関係なく、誰でもN3Cのダッシュボードを通じて研究提案を提出できる。市民科学者でさえ、データセットの匿名バージョンへのアクセスを求めることが可能だ。
ジョンズ・ホプキンス大学の委員会は各提案を検討し、研究者がアクセスできるデータのバージョンを決定する。アクセスできる情報には、限定的なデータセット、郵便番号と日付が隠された第2レベルの実データ、コンピューターが生成した「合成」データで、実際の患者データを含むことなく同じデータ属性を保持することに努める第3レベルのデータなど、複数の階層が …
- 人気の記事ランキング
-
- A tiny new open-source AI model performs as well as powerful big ones 720億パラメーターでも「GPT-4o超え」、Ai2のオープンモデル
- The coolest thing about smart glasses is not the AR. It’s the AI. ようやく物になったスマートグラス、真価はARではなくAIにある
- Geoffrey Hinton, AI pioneer and figurehead of doomerism, wins Nobel Prize in Physics ジェフリー・ヒントン、 ノーベル物理学賞を受賞
- Why OpenAI’s new model is such a big deal GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由