KADOKAWA Technology Review
×
オープンAI、有名アーティスト風のポップスを深層学習で生成
Getty
These pop songs were written by OpenAI’s deep learning algorithm

オープンAI、有名アーティスト風のポップスを深層学習で生成

オープンAIは、深層学習アルゴリズムを用いてポップスの楽曲を生成する人工知能(AI)を発表した。ケイティ・ペリー、エルビス・プレスリー、ナズといった有名なパフォーマーのスタイルで、そこそこの出来の「歌」を生成できる。 by Will Douglas Heaven2020.05.05

非営利の研究グループであるオープンAI(OpenAI)は、ポップス産業における新たな試みとして、ティーニーバップやカントリーから、ヒップホップ、ヘビーメタルまで、さまざまなスタイルでキャッチーな曲を生成できる「ジュークボックス(JukeBox)」と呼ばれるニューラル・ネットワークを発表した。このニューラルネットは、ちょっとした歌さえ歌うことができる。

ジャンルやアーティスト、歌詞をジュークボックスに入力すると、ジュークボックスはケイティ・ペリーエルビス・プレスリーナズといった有名なパフォーマーのスタイルで、そこそこの出来の寄せ集めの歌を生成する。また、曲の最初の数秒を入力して、残りの部分を自動補完させることもできる。

コンピューターに音楽を生成させる試みは50年以上の歴史がある。人工知能(AI)はこれまで、オーケストラ・クラシックとアンビエント電子音楽の印象的な作品をたくさん生成してきた。ビデオゲームはしばしばバックグラウンド音楽として、コンピューターが生成した音楽を使用し、プレイヤーの操作に応じてその場でループしたり、音の強弱を変えたりしている。

しかし、コンピューターにとっては、ビートルズのような音楽を生成するよりも、バッハのような音楽を生成する方がはるかに簡単だ。多くのクラシック音楽には数学的な下支えがあり、AIが作曲でよく用いる音楽の記号表現に適しているからだ。ポップソングはよりシンプルであるが、そうではない。

ジュークボックスの訓練には、ピッチ、楽器、タイミングといった抽象的な表現ではなく、120万曲の生のオーディオデータ自体を使用した。しかし、そのためには、いわゆる依存関係、すなわち典型的なポップソングの再生時間である3分間から4分間にわたって現れる繰り返しメロディを追跡できるニューラル・ネットワークが必要だった。AIには難しいタスクだ。このタスクの感覚を獲得するため、ジュークボックスは1曲あたり数百万のタイムスタンプを追跡し続ける。これに対し、オープンAIの言語ジェネレータ「GPT-2」が文章を追跡するときに使用するタイムスタンプは1000である。

ジュークボックスの生成するポップソングは、正直に言えば、まだまだのレベルだ。技術的に印象的ではあるものの、不気味な谷のかなり深いところにあると気づくだろう。オープンAIが目標とする汎用人工知能(AGI)からにはまだほど遠い。しかしジュークボックスは、ニューラル・ネットワークがいかに人間を模倣するかを改めて示し、現実のものとそうでないものの境界線を曖昧にしている。たとえば、先週、ラッパーのジェイ・Zは、自身がビリー・ジョエルの曲を歌っているディープフェイクの削除を求める法的措置を開始した。オープンAIは、AIが知的財産権に及ぼす影響に関する研究を計画していると述べている。

人気の記事ランキング
  1. How to talk to vaccine-hesitant people 「陰謀論者」で片付けない、ワクチン未接種者との対話のヒント
  2. What are the ingredients of Pfizer’s covid-19 vaccine? ファイザーの新型コロナワクチンの成分は?専門家が解説
ウィル・ダグラス・ヘブン [Will Douglas Heaven]米国版 AI担当上級編集者
AI担当上級編集者として、新研究や新トレンド、その背後にいる人々を取材しています。前職では、テクノロジーと政治に関するBBCのWebサイト「フューチャー・ナウ(Future Now)」の創刊編集長、ニュー・サイエンティスト(New Scientist)誌のテクノロジー統括編集長を務めていました。インペリアル・カレッジ・ロンドンでコンピュータサイエンスの博士号を取得しており、ロボット制御についての知識があります。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが主催するグローバル・アワード「Innovators Under 35 」の日本版が候補者を募集している。特定の分野や業界だけでなく、世界全体の重要な課題を解決するイノベーターを発信していく。

記事一覧を見る
人気の記事ランキング
  1. How to talk to vaccine-hesitant people 「陰謀論者」で片付けない、ワクチン未接種者との対話のヒント
  2. What are the ingredients of Pfizer’s covid-19 vaccine? ファイザーの新型コロナワクチンの成分は?専門家が解説
MITテクノロジーレビュー[日本版] Vol.4/Summer 2021
MITテクノロジーレビュー[日本版] Vol.4/Summer 202110 Breakthrough Technologies

新型コロナウイルス・ワクチンの開発で脚光を浴びた「メッセンジャーRNA」技術から、人間並みの文章を自在に生成できる人工知能(AI)技術「GPT-3」、電気自動車(EV)普及の鍵を握る「次世代バッテリー」まで。MITテクノロジーレビューが選んだ「世界を変える10大テクノロジー」。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る