
揺らぐ創造と複製の境界線、
音楽にもAIがやってくる
プロンプトに基づいて音楽を生成するAIモデルは、人間の創造性とは何かについて、私たちに本質的な問いを投げかけている。AIが生成した曲と人間が制作した曲を聴き比べるテストでは、音楽大学の教授でさえ、正答率が50%だった。 by James O'Donnell2025.05.01
- この記事の3つのポイント
-
- 拡散モデルによるAI音楽生成技術が急速に発展し、人間の作品と区別が難しい高品質な曲を生成している
- AI音楽企業は著作権問題で大手レコード会社から提訴され、創造と模倣の境界が問われている
- 実験では人々の半数近くがAI音楽を人間の作品と区別できず、芸術的価値の本質に新たな問いを投げかけている
「人工知能(AI)」という言葉は、コンピューティング分野のトップクラスの科学者がダートマス大学での夏季会議に集合した1956年に、かろうじて専門用語になった。コンピューター科学者のジョン・マッカーシーが、このイベントの資金調達提案書のために作った言葉だ。会議の目的は、言語を使用し、人間のように問題を解決し、自分自身を改善できる機械の構築方法への取り組みだった。しかし、この造語は適切な選択だった。人間の知能のどのような特徴も「原則として、機械が模倣できるように精密に記述できる」という、主催者の会議開催の前提を的確に捉えていたためだ。
このグループは提案書の中で、「AIにおける問題の局面」をいくつか挙げていた。リストの最後に、後知恵で最も困難な項目として挙げられていたのは、創造性と独創性を発揮できる機械を構築することだった。
当時、心理学者は人間の創造性を定義し、測定する方法に取り組んでいた。創造性は知能や高い知能指数(IQ)の産物であるという、広く普及した理論は色褪せつつあったが、心理学者はそれに代わるものが何かに確信を持てないでいた。ダートマス会議の主催者には独自の回答があった。「創造的思考と想像力に欠ける有能な思考の相違点は、いくらかのランダム性の注入にある」と述べ、そのランダム性は「効率的であるためには直感に導かれる必要がある」と付け加えている。
ダートマスでの会議から70年近く経過し、この分野の活況と低迷の多くのサイクルを経て現在、私たちはそのレシピに多少なりとも従うAIモデルを手に入れている。テキストを生成する大規模言語モデル(LLM)がこの3年間に爆発的に拡大する中、「拡散モデル(Diffusion Model)」と呼ばれるモデルをベースにした別の種類のAIが、創造領域に前例のない影響を及ぼしている。拡散モデルは、ランダムなノイズを統一性のあるパターンに転換して、テキストプロンプト(指示テキスト)やその他の入力データに基づいて新たな画像、ビデオ、音声を生成する。最良の拡散モデルは、人間の作品と見分けがつかない成果物も、明らかに非人間的な感じがする奇妙で超現実的な成果物も生み出すことができる。
現在、これらのAIモデルは、おそらく最も混乱に脆弱な創造領域である音楽へと向かいつつある。オーケストラ演奏からヘヴィメタルまで、音楽におけるAI生成による創造的作品は、他のどの領域のAI作品がなし得たよりも深く私たちの生活に浸透する態勢が整っている。AIモデルによって生成された楽曲は、誰が作ったかを私たちが気にかけるかどうかにお構いなく、ストリーミング・プラットフォーム、パーティや結婚式のプレイリスト、サウンドトラックなどに浸透していくだろう。
長年、拡散モデルは視覚芸術の世界で、生成物が意味しているのは創造なのか、それとも単なる複製なのかという議論を巻き起こしてきた。現在、この議論は音楽という、私たちの経験、記憶、社会生活に深く埋め込まれている芸術形式に及んできている。音楽モデルはいまや、本物の感情的な反応を引き出せる楽曲を制作可能になっており、AI時代に著作者や独創性の定義がどれだけ困難になりつつあるかを明確に例示している。
司法は、この曖昧な領域に積極的に取り組んでいる。大手レコード会社は、拡散モデルはアーティストに報酬を払わずに人間の芸術作品を複製しているに過ぎないと主張して、AI音楽生成の大手企業を訴えている。AIモデルの開発企業は、人間の創造を支援するためにこれらのツールを開発していると反論している。
誰が正しいかを決定するに当たり、私たちは人間自身の創造性について真剣に考えざるを得ない。人工ニューラル・ネットワークにせよ、生物学的なニューラル・ネットワークにせよ、創造性とは、ランダム性が散りばめられた、膨大な統計的学習とつながりの形成の結果に過ぎないのだろうか? もしそうであれば、著作者とは不確かな概念だ。そうではなく、創造性に明確な人間的要素があるとすれば、それは何だろうか? 人間のクリエイターが関与しなかったものに感動を覚えるとは、どういうことだろうか? ——AIが生成した本当にすばらしい楽曲を初めて聴いたとき、私はこれらの質問と格闘しなければならなかった。誰かがプロンプトを書いて「生成」をクリックしただけだと知り、不安になったのだ。その状況は、あなたにも間もなく訪れつつある。
つながりを形成する
ダートマス会議の後、参加者はお互いに異なる方向へと研究を進め、AIの基礎技術を生み出した。同時期に、認知科学者らが、米国心理学会(American Psychological Association)のJ・P・ギルフォード会長による1950年の呼びかけに応じて、人間の創造性の問題に取り組んだ。心理学者のモリス・スタインは1953年に、心理学ジャーナル(Journal of Psychology)でこの問題を初めて定式化し、「創造的作品とは、何か新しいものを提示する新奇性と、誰かにとって何らかの目的を果たす有用性を兼ね備えている」という定義にたどり着いた。「有用性」を「満足感」に置き換えるべきであると呼びかける人や、「創造的なものは驚きも与える」という第三の基準を打ち出す人もいる。
その後、1990年代に機能的核磁気共鳴画像法(fMRI)が台頭し、音楽を含む多くの領域で、創造性の基盤となる神経機構の研究をさらに進展させることが可能になった。加えて、過去数年間の計算手法により、創造的な意思決定に果たす記憶と連想思考の役割を明確にすることが容易になった。
そうして浮上してきたのは、創造的なアイデアが脳内でどのように発生し展開するかに関する大統一理論ではなく、かつてなく増え続ける強力な観察のリストだ。私たちは初めて、人間の創造プロセスを2つの段階、つまりアイデア創出または提案の段階と、その後にアイデアの価値を吟味するより批判的かつ評価的な段階に分けることができた。これら2つの段階を導く主要理論の一つは「創造性連想理論」と呼ばれ、最も創造的な人たちは離れた概念どうしの間に新たなつながりを形成できると想定している。
「活性化の拡散のようなものかもしれません」。ペンシルベニア州立大学の創造性認知神経科学研究室(Cognitive Neuroscience of Creativity Laboratory)を率いるロジャー・ビーティー准教授は言う。「一つのことを考えるとします。すると、それがどのような概念であっても、関連する概念群が活性化されます」。
このようなつながりは、特定の時間や場所の記憶を保存するエピソード記憶とは異なる、概念や事実を保存する意味記憶に特に依存することが多い。最近、大きな「意味的距離」のある概念どうしの間でつながりが形成される方法を研究するために、より高度な計算モデルが使用されている。たとえば、「黙示(apocalypse)」という単語は、「祝賀(celebration)」よりも「原子力発電(nuclear power)」に近い。研究によると、創造性の高い人は意味的に非常に異なる概念を近くの存在として感知する可能性があることが示されている。アーティストは、アーティストでない人に比べて大きな距離のある単語連想を生み出すことも分かっている。別の研究では、創造的な人は「漏れやすい」注意力を持っているという考えが支持されている。これは、目の前の課題と特に関係がないかもしれない情報に気づくことが多いことを意味している。
これらのプロセスを神経科学的手法で評価しても、創造性が脳の特定の領域で展開されるという示唆は得られない。「脳内には、内分泌腺がホルモンを分泌するように、創造性を生み出すものは何もない」。創造性研究の指導者の一人であるディーン・キース・サイモントンは、『Cambridge Handbook of the Neuroscience of Creativity(ケンブリッジ版 創造性の神経科学ハンドブック)」(未邦訳)にこう記している。
ビーティー准教授によると、それに代えて、創造的思考に際して分散されたいくつかの活動ネットワークが存在することが、エビデンス(科学的根拠)では示されているという。そのうちの一つは連想思考を通じたアイデアの初期生成をサポートし、別の一つは有望なアイデアを特定し、さらに別の一つは評価と修正を担当する。ハーバード大学医学大学院の研究チームが主導する、2月に発表された新たな研究では、創造性には自己検閲に関わるものなど、特定の脳ネットワークの抑制も関わっている可能性が示されている。
現在、機械の創造性と呼べるものがあったとして、それはまったく異なって見える。ダートマス会議当時、AI研究者は人間の脳に着想を得た機械に関心を有していたが、拡散モデルが発明された約10年前に …
- 人気の記事ランキング
-
- Phase two of military AI has arrived 米軍で導入進む「戦場のLLM」、未解決の3つの課題とは?
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- A Google Gemini model now has a “dial” to adjust how much it reasons 推論モデルは「考えすぎ」、グーグルがGeminiに調整機能
- The awakening of a “silent giant”: How Chinese AI models shocked the world 動き出した「静かな巨人」、中国発のAIモデルが世界に与えた驚き