2022年12月、カリフォルニア大学バークレー校(UCバークレー)で人工知能(AI)の博士号を取得している最中、ティム・ブルックスは動画生成AIによって自分の足跡を残すのにちょうどよい時期が訪れたと感じた。1カ月前のChatGPT(チャットGPT)のローンチにより、生成AIがその瞬間を迎えていた。シンプルなプロンプトを通じて、ユーザーは流暢な会話でチャットボットと関わることができ、高解像度で現実的な画像を作成できる画像生成AIも登場していた。しかし、動画生成AIはまだ実際には機能していなかった。初期のモデルは特定の風景をシミュレートしたり、静止画像に少しの動きを与えたりすることで進歩を遂げていた。高品質で汎用化されたモデルは依然として実現困難だった。
31歳のブルックスがその後すぐにオープンAI(OpenAI)に入社した時、競争が始まった。UCバークレー時代の同僚のビル・ピーブルズと共に、最大1分間の高解像度クリップを生成できるモデルの開発を始めた。彼らの戦略は、画像と動画をより小さな情報のビットに分解する新しい方法を含んでおり、これによってより広範囲の視覚データでモデルを訓練できた。また、ほとんどのチャットボットを支えるものと同様のトランスフォーマー・アーキテクチャーを活用し、スケールアップするにつれてモデルが徐々に向上することを可能にした。最終成果は2024年12月に一般公開された画期的な動画ジェネレーター「Sora(ソラ)」だった。
グーグルやメタ(Meta)などの動画生成AI製品と同様に、Soraは魅力と同時に警戒も引き起こした。一部の批評家は、これらのモデルが広告、映画、その他のクリエイティブ産業全体で職の喪失につながることを懸念している。そして、ほとんどのSoraユーザーは、ディープフェイクや偽情報の拡散に対する恐れから、実在の人物を描いた動画の作成が禁止されている。また、インターネット全体に蔓延している低品質コンテンツ「AIスロップ」の生産増加につながることへの懸念もある。
しかしブルックスは、これらのツールがデジタル・クリエイターに新しい可能性を開くと信じている。また、彼がグーグル・ディープマインドの研究科学者としての新しい役割で追求している目標、AIが私たちの物理的環境をよりよく理解し、人間の脳の機能により近似する、より遠大な「世界モデル」構築への重要なステップとしても見ている。
- 人気の記事ランキング
-
- This company claims a battery breakthrough. Now they need to prove it. すべてのパラメーターが矛盾——「出来すぎ」全固体電池は本物か?
- OpenAI’s “compromise” with the Pentagon is what Anthropic feared アンソロピック排除の裏で進んだオープンAIの軍事契約、その代償は
- AI is rewiring how the world’s best Go players think 「アルファ碁」から10年、 AIは囲碁から 創造性を奪ったのか
- How uncrewed narco subs could transform the Colombian drug trade 中には誰もいなかった—— コカイン密輸組織が作った 「自律潜水ドローン」の脅威