- ラッセル・ブランダム 1 Stories
- プロフィールを見る
-
-
人工知能(AI)
AIの実力、どう測る?
時代遅れのベンチマーク、
信頼できる評価方法とは
-
シリコンバレーのAI企業が熱狂するベンチマークテスト。だが、その評価方法には深刻な欠陥があることが明らかになってきた。高得点を競う企業は「テスト対策」に走り、本来測るべき能力が正確に評価されていない現状が「評価の危機」を引き起こしている。
Russell Brandom6時間前
- フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る
-