Cover Story
エビデンスは後回し? 大手AI企業が目をつけた 「ヘルスAI」の危うさ
ChatGPT(チャットGPT)が軽度の症状に過度な治療を推奨し、緊急事態を見落とす——そんな研究結果が出ても、ヘルスAIの公開は加速している。マイクロソフト、アマゾン、オープンAIが競うこの市場で、安全性の第三者評価は追いついていない。グーグルは同等の研究を経て公開を見送った。
by Grace Huckins-
主張:現場で使えないAIベンチマーク、「学校の試験」からの転換を
AIは真空状態でテストされ、混沌とした現場で失敗する。英国の病院では、高得点の医療AIが多職種チームの中で遅延をもたらした。単独タスクの精度を測る「学校のテスト」型ベンチマークでは、こうした実態は見えない。人間チームとの協働を長期的に評価する新たな枠組みが必要だ。
by Angela Aristidou