KADOKAWA Technology Review
×
【春割】実施中!年間購読料20%オフ!
失われた声を取り戻す
AIクローンがMND患者の
新しい声になるまで
Eleni Rodriguez Maltagliati
生物工学/医療 Insider Online限定
Motor neuron diseases took their voices. AI is bringing them back.

失われた声を取り戻す
AIクローンがMND患者の
新しい声になるまで

運動ニューロン疾患(MND)によって声を失った患者たちに、新たな希望が生まれている。AI技術を用いた音声クローンだ。従来の人工音声とは異なり、患者本来の声に限りなく近い自然な発話を可能にする。 by Jessica Hamzelou2025.02.19

この記事の3つのポイント
  1. 音声クローン技術がALSなどで声を失った人々のコミュニケーションを支援
  2. 課題は残るものの、従来よりもリアルな声の再現に希望が広がっている
  3. 患者の表情を再現するアバター技術の開発も進められている
summarized by Claude 3

ジュールズ・ロドリゲスは、昨年の10月に声を失った。彼は2020年に筋萎縮性側索硬化症(ALS:Amyotrophic Lateral Sclerosis)と診断され、それ以来、頭部や首の筋肉が全身の筋肉とともに徐々に衰え、発話能力が低下していった。

2024年になると、医師たちは彼が自発呼吸できなくなるのも時間の問題だと懸念していた。そこでロドリゲスは、呼吸を補助するために気管に小さなチューブを挿入する選択をした。気管切開は彼の命を延ばす一方で、発話能力を完全に奪うことにもなった。

「気管切開は、ALS患者にとって非常に恐ろしい決断です。それは人生の新たな段階に踏み入れること、つまり死に近づくことを意味するからです」と、ロドリゲスはコミュニケーション機器を使って私に伝えた。「手術を受ける前は、まだある程度の自立ができ、わずかに話すこともできました。しかし今では、私の呼吸を補助する機械に永久的につながれています」。

フロリダ州マイアミに住むロドリゲスと妻のマリア・フェルナンデスは、彼の声を二度と聞くことはないだろうと思っていた。しかし、2人は人工知能(AI)を使って彼の声を再現することに成功した。映画、テレビ、ラジオ、ポッドキャストの音声で訓練されたツールに、過去のロドリゲスの録音データを入力することで、夫妻は彼の「昔の声」のクローンを生成した。これにより、ロドリゲスはかつての自分の声でコミュニケーションができるようになったのだ。

「しばらく聞くことのなかった自分の声を再び耳にして、気持ちが高揚しました」とロドリゲスは語る。彼は現在、目の動きを追跡する装置を使って文章を入力し、その内容をクローン音声で「話す」ことでコミュニケーションしている。この音声クローンにより、他者との交流や意思疎通が容易になったと彼は言う。また、舞台でコメディを演じる際にもこの音声クローンを活用している。

ロドリゲスは、イレブンラボ(ElevenLabs)がこの音声クローンツールの無料提供を始めて以来、ずっと使い続けている人の一人だ。ツールは発話障害を持つ1000人以上の人たちに利用されている。多くの新技術と同様に、AI音声クローンも完璧ではなく、日常生活では実用的でないと感じる人もいる。しかし、その音声技術はこれまでのコミュニケーション支援技術と比べて大幅に進歩しており、すでに運動ニューロン疾患(MND:Motor Neuron Diseases)を持つ人々の生活を改善していると、英国の運動ニューロン疾患協会(MND協会)の言語聴覚士リチャード・ケイヴ博士は語る。「これはまさに、AIのよい使い道の一例です」。

声のクローン作成

運動ニューロン疾患とは、筋肉や運動を制御するニューロンが徐々に破壊されていく疾患の総称である。診断が難しいケースもあるが、通常、この疾患を持つ人々は、徐々にさまざまな筋肉を動かす能力を失っていく。そして最終的には、呼吸することも困難になる。現在、この疾患に対する治療法は存在しない。

ロドリゲスは2019年の夏にALSの症状を訴え始めた。「左肩の力が弱くなり始めたんです」と、ビデオ通話の際に隣に座っていた妻のフェルナンデスは語る。「私たちは、単なる昔のスポーツでの怪我の影響だと思っていました」。しかし、その後、彼の腕は細くなり始めた。11月には、ビデオゲームをしている最中に右手の親指が「動かなくなった」。2020年2月、ロドリゲスが手の専門医の診察を受けた際、ALSの可能性があると告げられた。彼が35歳のときだった。「手のことを診てもらった医師からそんな話を聞くなんて、本当にショックでした」とフェルナンデスは言う。「まさに打ちのめされました」。

他のALS患者と同様に、ロドリゲスも自身の声を「預ける」よう勧められた。つまり、何百ものフレーズを録音し、それをコミュニケーション機器で使用する「保存された声」として合成するのだ。しかし、その結果はぎこちなく、ロボットのような不自然な音声だった。

これまでに運動ニューロン疾患の患者およそ50人の声を保存する手伝いをしてきたケイヴ博士によると、これはよくあることだという。「私が7年ほど前にMND協会で働き始めた頃は、患者は1500ものフレーズを読み上げなければなりませんでした」。それは何カ月もかかる、非常に骨の折れる作業だった。

出来上がった音声がどれほど自然なものになるかを事前に予測する方法もなく、実際に生成される音声はしばしば非常に人工的に聞こえた。「多少は本人の声に似ているかもしれませんが、決して本人の声と間違えるほどではありません」とケイヴ博士は言う。その後、技術は進歩し、ここ1~2年で彼が支援した患者は、わずか30分ほどの録音で済むようになった。しかし、プロセスが短縮されたとはいえ、生成された合成音声は依然としてリアルなものとは言えなかったとケイヴ博士は話す。

そこへ登場したのが、AIによる音声クローン技術だった。イレブンラボは、3年前の創業当初から映画、テレビ、ポッドキャスト向けのAI音声を開発してきた。同社で非営利団体との提携を統括するソフィア・ノエルは説明する。当初の目標は、吹き替えの品質を向上させ、別の言語でのナレーションやセリフをより自然で違和感のないものにすることだった。しかしその後、ALS患者のコミュニケーションを支援する団体「ブリッジング・ボイス(Bridging Voice)」の技術責任者から、イレブンラボの音声クローン技術がALS患者にとって非常に有用であるとの報告を受けたという。そして昨年8月、イレブンラボは発話障害を持つ人たちがこの技術を自由に利用できるようにするプログラムを立ち上げた。

「突然、音声クローンの作成が格段に速く、簡単にな …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
【春割】実施中!年間購読料20%オフ!
人気の記事ランキング
  1. Will fusion power get cheap? Don’t count on it. 核融合は本当に安くなるのか? 楽観論に「待った」をかける新研究
  2. Digging for clues about the North Pole’s past 12万年前は無氷だった?海底22メートルの泥で掘り起こす北極点の謎
  3. Is carbon removal in trouble? 炭素除去業界に激震、最大顧客のマイクロソフトが購入を一時停止
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る