KADOKAWA Technology Review
×

人工知能(AI) 2025年6月の記事

  1. Are we ready to hand AI agents the keys?
    旅行の予約、メールの整理、プログラムの作成──AIエージェントが人間の秘書や助手として活躍し始めた。しかし指示を誤解して想定外の行動を取ったり、ハッカーに悪用される危険性、さらには職への影響も懸念される。次に起こることへの備えはできているのだろうか。 by Grace Huckins2025.6.17
  2. 中国のスタートアップが開発した「Manus(マヌス)」はAIエージェントブームを巻き起こした。これを皮切りに中国では汎用AIエージェント開発ラッシュが始まり、海外進出を狙う動きが活発化している。 by Caiwei Chen2025.6.16
  3. 米国防総省の安全性テスト部門が縮小、AI兵器の導入加速へ
    米国防総省は兵器やシステムの安全性をテストし評価する運用試験評価局の人員をおよそ半分に削減した。AIの軍事導入が進む中、戦闘中に表面化する問題を見逃してしまう可能性がある。 by James O'Donnell2025.6.15
  4. 身長1.8メートル、体重65キロの人型ロボットが突然転倒したら——。従来のような緊急停止が通用しない人型ロボットの安全基準づくりが急ピッチで進んでいる。 by Victoria Turk2025.6.13
  5. 動画生成は別次元、思ったより深刻だったAIの電力問題
    AIによるエネルギー需要の増大についての特集記事を執筆するために多くの専門家に取材した結果、大きく3つの教訓を得ることができた。衝撃的だったのは、低品質の5秒間のビデオでさえ、大量のエネルギーを必要とすることだ。 by James O'Donnell2025.6.13
  6. What’s next for AI and math
    大規模言語モデルが苦手としていた数学の能力を急速に向上させている。AIはいずれ、プロの数学者でも解けないような問題を解けるようになるのだろうか。 by Will Douglas Heaven2025.6.9
  7. This benchmark used Reddit’s AITA to test how much AI models suck up to us
    過剰なLLMの「ヨイショ度」を計測するベンチマークが登場
    大規模言語モデルがユーザーに媚びへつらう「シカファンシー」問題の測定ツールが登場した。スタンフォード大学などの研究チームが開発したベンチマークは、レディットの投稿を用いてAIの過度な同調傾向を数値化。オープンAIなど8社のモデル評価で、すべてが人間を大きく上回る同調率を記録している。 by Rhiannon Williams2025.6.2
アーカイブ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る