KADOKAWA Technology Review
×
【12/17開催・参加無料】AI、気候テック…次の「社会実装」はどうなる? 未来の潮流を掴むIU35サミット
生成AIの陰で見過ごされる「予測AI」、命を救う静かな革命
Derek Brahney
Generative AI hype distracts us from AI’s more important breakthroughs

生成AIの陰で見過ごされる「予測AI」、命を救う静かな革命

生成AIの誇大宣伝が、真に有益な「予測AI」から注意をそらしている。予測AIは病変検出、地震予測、自動運転で既に活躍し、エネルギー効率も高い。ハギングフェイスの主任倫理科学者は「派手なデモではなく、静かで厳密な進歩こそがAIの未来を築く」と訴える。 by Dr Margaret Mitchell2025.12.16

この記事の3つのポイント
  1. 2022年4月、ポール・マッカートニーがAI技術でジョン・レノンとの共演を実現し、音声・映像処理技術の画期的応用を披露した
  2. 生成AIの注目に対し、予測AIは既に天気予報、医療診断、自動運転など日常生活の重要分野で静かに革新を続けている
  3. エネルギー効率と持続可能性を重視し、予測技術を基盤とした信頼性の高いAI開発が真の社会的影響をもたらす鍵となる
summarized by Claude 3

2022年4月28日、ワシントン州スポケーンで開催された待望のコンサートで、ミュージシャンのポール・マッカートニーは、画期的な人工知能(AI)技術の応用によって観客を驚かせた。彼は、長年亡くなった音楽パートナーであるジョン・レノンの生き生きとした映像とともに演奏を始めたのである。

音声と映像処理の最新技術を用いて、エンジニアたちは1969年ロンドンでの2人の最後の演奏映像から、レノンの声と姿をオリジナルのミックスから分離し、生き生きとした鮮明さで復元した。

私のような研究者は、このような瞬間を実現するために、長年にわたって機械に「見ること」と「聞くこと」を教えてきた。マッカートニーとレノンが時空を超えて再会するかのような光景に、アリーナは静まり返り、多くの観客が涙を流した。AI科学者であり、生涯のビートルズファンでもある私は、この本当に人生を変えるような瞬間を体験できたことに深い感謝を感じた。

その年の後半、世界は別の大きなブレークスルーに心を奪われた。それは「AIとの会話」だった。歴史上初めて、ChatGPT(チャットGPT)の登場により、事実上あらゆる主題について文脈に応じた新たな発言をリアルタイムで生成できるシステムが広く利用可能になった。何十億もの人々が突然、AIと対話できるようになったのである。これは、AIが将来どうなり得るのかについて人々の想像力に火をつけ、創造的なアイデア、希望、そして恐怖が一気に噴き出すきっかけとなった。

長らくニッチな分野とされてきたAIによる言語生成で博士号を取得した私は、この技術がここまで到達したことに胸を躍らせた。一方で、私が感じた畏敬の念は、「生成AIが実際にはできないことをできると断言し、それを使わなければ時代に取り残される」と警告するメディア報道や自称専門家の洪水に対する憤りに匹敵するものだった。

この種の誇大宣伝は、AIが実際に何であり、何ができて何ができないのかについての誤解をさらに煽っている。重要なのは、生成AIは、あなたの人生をより良くし、あるいは救う可能性が最も高いAI、すなわち予測AIから注意をそらす魅惑的な存在だということである。生成タスク用に設計されたAIとは対照的に、予測AIは、あらかじめ定められた有限の答えの中から正解を選ぶタスクに関わる。システムは情報を処理し、どの答えが正しいかを判断するだけでよい。たとえば、植物認識のようなものである。スマートフォンのカメラを植物に向けると、それがウエスタンソードファーン(編注:米太平洋岸北西部原産の大型の常緑シダ植物)であると判別される。これに対して、生成タスクには明確な正解の集合が存在しない。システムは、たとえば新しいシダ植物の絵を作成するために、学習データの断片を組み合わせる必要がある。

チャットボットや顔の合成、合成映像などの生成AI技術は、見事なデモンストレーションを生み出し、超人的なAIが豊かさあるいは絶滅をもたらすという幻想によって、クリック数や売上を牽引している。一方、予測AIは静かに、天気予報や食品の安全性を向上させ、高品質な音楽制作を可能にし、写真整理を支援し、最速ルートを正確に予測している。私たちは気づかぬうちに、予測AIを日常生活に取り入れており、それはこの技術の不可欠な有用性を物語っている。

予測AIの飛躍的な進歩とその将来性を理解するには、この20年間の軌跡を振り返るのがよい。2005年当時、AIに人と鉛筆の違いを教えることさえできなかった。2013年になっても、写真の中の鳥を確実に認識できず、歩行者とコカコーラのボトルの違いに困惑していた(ボトルは、頭のない人間のように見えることがあると、そのとき初めて知った)。このようなシステムを現実世界に展開するという発想は、SFの世界に属するものだった。

しかし過去10年で、予測AIは特定の鳥の種まで正確に識別できるようになっただけでなく、病変や心房細動の検出といった命に関わる医療分野にも急速に応用が進んだ。この技術のおかげで、地震学者は地震を、気象学者は洪水を、かつてない精度で予測できるようになった。鼻歌から曲名を特定したり、運転中に避けるべき障害物を認識したりするなど、消費者向け技術の精度も急上昇しており、自動運転車の実用化に貢献している。

近い将来には、腫瘍の正確な検出や、誰かに被害を及ぼす前のハリケーンの予測も可能になるだろう。それは、スタジオジブリ風の映画を生成するような派手さには欠けるかもしれないが、十分に注目に値する成果である。

予測AIシステムは、限定された選択肢の中で特定の生成技術を取り入れることで、非常に高い有用性を発揮することも示されている。この種のシステムは多岐にわたり、服装の視覚化から多言語翻訳まで幅広い応用がある。近い将来、予測・生成ハイブリッドシステムにより、他言語を話す自分自身の声をリアルタイムで再現できるようになり、旅行の強力なサポートとなるだろう(深刻ななりすましのリスクもあるが)。この分野には大きな成長の余地があるが、生成AIは強力な予測技術と組み合わさって初めて真の価値を発揮する。

この2つのAIの違いを理解するために、AIシステムとして「猫がどのようなものかを誰かに示す」という課題を想像してみてほしい。生成的アプローチでは、さまざまな猫の画像から小さな断片を切り貼りして、見た目には完璧な猫のイメージを構築する。現代の生成AIが、こうした完成度の高いコラージュを作成できることこそが、その驚異的な能力の源泉である。

あるいは、予測的アプローチをとることもできる。ただ既存の猫の写真を見つけて、それを指し示すだけだ。この方法は地味だが、エネルギー効率が高く、より正確で、元の情報源を正しく認識する可能性が高い。生成AIは「本物のように見えるもの」を作るよう設計されており、予測AIは「本物そのものを識別する」。生成AIが検索していると誤解されがちだが、実際には新たに生成しているのであり、これがテキストに関わる場合には重大な問題を引き起こし、裁判所の判決や科学論文の撤回を招くことさえある。

この混乱を助長しているのは、人々がAIについて語るときに、それがどのタイプのAIなのかを明確にしないまま誇大宣伝する傾向にある(実際、多くの人はその違いを知らないと思う)。多くの人は「AI」を生成AI、あるいは単に言語生成AIと同一視し、その他すべての能力がそこから派生すると誤って仮定している。この誤解はもっともらしく聞こえる。というのも、「知能」という言葉は、我々人間にとって言語使用と密接に結びついているからだ(ネタバレすると、誰も「知能」が何かを正確には知らない)。そもそも「人工知能」という言葉は、1950年代に人間的なものを想起させ、畏敬の念を引き起こすために意図的に作られた。しかし現在では、それは単にデジタルデータを処理するためのさまざまな技術の総称にすぎない。私の友人の中には、代わりに「数理的数学(mathy maths)」と呼ぶとわかりやすいと感じる者もいる。

生成AIを、最も強力で「本物の」AIであるかのように扱う傾向は、予測AIよりもはるかに多くのエネルギーを消費するという事実を踏まえると、問題がある。また、それは元のクリエイターの意思に反して彼らの作品をAI製品に取り込み、そもそもその能力を可能にしたクリエイターの仕事を、報酬なしにAIで代替することにもつながる。AIは非常に強力になり得るが、それはクリエイターが搾取されてよいということにはならない。

テック業界のAI開発者として、こうした状況の展開を見守る中で、私は次のステップに向けて重要な教訓を得た。AIの広範な魅力は、会話ベースのインターフェースという直感的な形態と密接に関係している。しかし、現在この手法は、本来なら予測手法で十分な場合にも過度に生成手法を用いており、ユーザーの混乱を招くだけでなく、エネルギー消費、搾取、雇用喪失という深刻なコストを生み出している。

私たちは、AIの真の可能性のほんの一端を目撃したにすぎない。現在のAIへの熱狂は、それが「今どうであるか」ではなく、「将来どうなり得るか」に基づいている。生成アプローチは、表現の多様性や正確性、そして作品に組み込まれた人々の意思という点で、いまだ多くの課題を抱えたまま、リソースに過度な負担をかけている。

もし私たちが、生成技術をめぐる誇大な宣伝から、すでに日常生活を変えている予測技術へと焦点を移すことができれば、真に有益で、公平で、持続可能なAIを築くことができる。医師がより早く病気を発見し、科学者がより迅速に災害を予測し、一般の人々がより安全に暮らせるよう支援するシステムこそが、最も大きなインパクトをもたらす準備が整っている。

真に有益なAIの未来は、最も派手なデモではなく、技術を信頼できるものにする静かで厳密な進歩によって築かれる。そして、その土台の上に、予測能力と成熟したデータ運用、直感的な自然言語インターフェースを組み合わせることで、AIはようやく現在多くの人が期待している約束を実現し始めることができる。

マーガレット・ミッチェル博士は、コンピュータサイエンス研究者であり、AIスタートアップのハギングフェイス(Hugging Face)の主任倫理科学者である。業界で15年以上の経験を持ち、自然言語生成、支援技術、コンピュータービジョン、AI倫理に関する論文を100本以上発表してきた。その研究は数々の賞を受賞し、複数のテック企業によって実装されている。

人気の記事ランキング
  1. How AI is uncovering hidden geothermal energy resources AIが「隠れた地熱」を発見、地表に兆候なくても地下の熱源を特定
  2. Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
  3. Can “The Simpsons” really predict the future? トランプもコロナも予言?『ザ・シンプソンズ』責任者が語る陰謀論の真相
dr.margaret.mitchell [Dr Margaret Mitchell]米国版
Dr. Margaret Mitchell is a computer science researcher and chief ethics scientist at AI startup Hugging Face. She has worked in the technology industry for 15 years, and has published over 100 papers on natural language generation, assistive technology, computer vision, and AI ethics. Her work has received numerous awards and has been implemented by multiple technology companies.
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
気候テック企業10 2025

MITテクノロジーレビューは毎年、気候テック分野で注目すべき企業を選出し、その一覧を発表している。 新たなクリーン・エネルギー源の創出や、食品生産・物流の再構築といった形で経済の主要セクターの脱炭素化に取り組む注目企業10社を紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る