KADOKAWA Technology Review
×
失われた声を取り戻す
AIクローンがMND患者の
新しい声になるまで
Eleni Rodriguez Maltagliati
生物工学/医療 Insider Online限定
Motor neuron diseases took their voices. AI is bringing them back.

失われた声を取り戻す
AIクローンがMND患者の
新しい声になるまで

運動ニューロン疾患(MND)によって声を失った患者たちに、新たな希望が生まれている。AI技術を用いた音声クローンだ。従来の人工音声とは異なり、患者本来の声に限りなく近い自然な発話を可能にする。 by Jessica Hamzelou2025.02.19

この記事の3つのポイント
  1. 音声クローン技術がALSなどで声を失った人々のコミュニケーションを支援
  2. 課題は残るものの、従来よりもリアルな声の再現に希望が広がっている
  3. 患者の表情を再現するアバター技術の開発も進められている
summarized by Claude 3

ジュールズ・ロドリゲスは、昨年の10月に声を失った。彼は2020年に筋萎縮性側索硬化症(ALS:Amyotrophic Lateral Sclerosis)と診断され、それ以来、頭部や首の筋肉が全身の筋肉とともに徐々に衰え、発話能力が低下していった。

2024年になると、医師たちは彼が自発呼吸できなくなるのも時間の問題だと懸念していた。そこでロドリゲスは、呼吸を補助するために気管に小さなチューブを挿入する選択をした。気管切開は彼の命を延ばす一方で、発話能力を完全に奪うことにもなった。

「気管切開は、ALS患者にとって非常に恐ろしい決断です。それは人生の新たな段階に踏み入れること、つまり死に近づくことを意味するからです」と、ロドリゲスはコミュニケーション機器を使って私に伝えた。「手術を受ける前は、まだある程度の自立ができ、わずかに話すこともできました。しかし今では、私の呼吸を補助する機械に永久的につながれています」。

フロリダ州マイアミに住むロドリゲスと妻のマリア・フェルナンデスは、彼の声を二度と聞くことはないだろうと思っていた。しかし、2人は人工知能(AI)を使って彼の声を再現することに成功した。映画、テレビ、ラジオ、ポッドキャストの音声で訓練されたツールに、過去のロドリゲスの録音データを入力することで、夫妻は彼の「昔の声」のクローンを生成した。これにより、ロドリゲスはかつての自分の声でコミュニケーションができるようになったのだ。

「しばらく聞くことのなかった自分の声を再び耳にして、気持ちが高揚しました」とロドリゲスは語る。彼は現在、目の動きを追跡する装置を使って文章を入力し、その内容をクローン音声で「話す」ことでコミュニケーションしている。この音声クローンにより、他者との交流や意思疎通が容易になったと彼は言う。また、舞台でコメディを演じる際にもこの音声クローンを活用している。

ロドリゲスは、イレブンラボ(ElevenLabs)がこの音声クローンツールの無料提供を始めて以来、ずっと使い続けている人の一人だ。ツールは発話障害を持つ1000人以上の人たちに利用されている。多くの新技術と同様に、AI音声クローンも完璧ではなく、日常生活では実用的でないと感じる人もいる。しかし、その音声技術はこれまでのコミュニケーション支援技術と比べて大幅に進歩しており、すでに運動ニューロン疾患(MND:Motor Neuron Diseases)を持つ人々の生活を改善していると、英国の運動ニューロン疾患協会(MND協会)の言語聴覚士リチャード・ケイヴ博士は語る。「これはまさに、AIのよい使い道の一例です」。

声のクローン作成

運動ニューロン疾患とは、筋肉や運動を制御するニューロンが徐々に破壊されていく疾患の総称である。診断が難しいケースもあるが、通常、この疾患を持つ人々は、徐々にさまざまな筋肉を動かす能力を失っていく。そして最終的には、呼吸することも困難になる。現在、この疾患に対する治療法は存在しない。

ロドリゲスは2019年の夏にALSの症状を訴え始めた。「左肩の力が弱くなり始めたんです」と、ビデオ通話の際に隣に座っていた妻のフェルナンデスは語る。「私たちは、単なる昔のスポーツでの怪我の影響だと思っていました」。しかし、その後、彼の腕は細くなり始めた。11月には、ビデオゲームをしている最中に右手の親指が「動かなくなった」。2020年2月、ロドリゲスが手の専門医の診察を受けた際、ALSの可能性があると告げられた。彼が35歳のときだった。「手のことを診てもらった医師からそんな話を聞くなんて、本当にショックでした」とフェルナンデスは言う。「まさに打ちのめされました」。

他のALS患者と同様に、ロドリゲスも自身の声を「預ける」よう勧められた。つまり、何百ものフレーズを録音し、それをコミュニケーション機器で使用する「保存された声」として合成するのだ。しかし、その結果はぎこちなく、ロボットのような不自然な音声だった。

これまでに運動ニューロン疾患の患者およそ50人の声を保存する手伝いをしてきたケイヴ博士によると、これはよくあることだという。「私が7年ほど前にMND協会で働き始めた頃は、患者は1500ものフレーズを読み上げなければなりませんでした」。それは何カ月もかかる、非常に骨の折れる作業だった。

出来上がった音声がどれほど自然なものになるかを事前に予測する方法もなく、実際に生成される音声はしばしば非常に人工的に聞こえた。「多少は本人の声に似ているかもしれませんが、決して本人の声と間違えるほどではありません」とケイヴ博士は言う。その後、技術は進歩し、ここ1~2年で彼が支援した患者は、わずか30分ほどの録音で済むようになった。しかし、プロセスが短縮されたとはいえ、生成された合成音声は依然としてリアルなものとは言えなかったとケイヴ博士は話す。

そこへ登場したのが、AIによる音声クローン技術だった。イレブンラボは、3年前の創業当初から映画、テレビ、ポッドキャスト向けのAI音声を開発してきた。同社で非営利団体との提携を統括するソフィア・ノエルは説明する。当初の目標は、吹き替えの品質を向上させ、別の言語でのナレーションやセリフをより自然で違和感のないものにすることだった。しかしその後、ALS患者のコミュニケーションを支援する団体「ブリッジング・ボイス(Bridging Voice)」の技術責任者から、イレブンラボの音声クローン技術がALS患者にとって非常に有用であるとの報告を受けたという。そして昨年8月、イレブンラボは発話障害を持つ人たちがこの技術を自由に利用できるようにするプログラムを立ち上げた。

「突然、音声クローンの作成が格段に速く、簡単にな …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. AI reasoning models can cheat to win chess games 最新AIモデル、勝つためなら手段選ばず チェス対局で明らかに
  2. This artificial leaf makes hydrocarbons out of carbon dioxide 人工光合成が次段階へ、新型人工葉が炭化水素合成に成功
  3. An ancient man’s remains were hacked apart and kept in a garage 切り刻まれた古代人、破壊的発掘から保存重視へと変わる考古学
  4. AGI is suddenly a dinner table topic 膨らんではしぼむ「AGI」論、いまや夕食時の話題に
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る