KADOKAWA Technology Review
×
【春割】実施中!年間購読料20%オフ!
ロブロックス、プロンプトから3D環境を自動生成するAI提供へ
Roblox
Roblox is launching a generative AI that builds 3D environments in a snap

ロブロックス、プロンプトから3D環境を自動生成するAI提供へ

人気オンラインゲーム・プラットフォームのロブロックスが、3Dゲーム環境を構築できる生成AIを開発。プロンプトから背景を生成し、ゲーム開発者の負担を軽減する。 by Scott J Mulligan2024.09.11

この記事の3つのポイント
  1. ロブロックスがテキスト入力で3D背景を生成するAIを提供する計画を発表
  2. AIモデルは3Dブロックをトークン化し確率に基づいて背景環境を構築する
  3. ロブロックスは3D基盤モデルのオープンソース化を予定している
summarized by Claude 3

オンラインゲーム・プラットフォームのロブロックス(Roblox)は9月6日、クリエイターがテキスト・プロンプト(指示テキスト)を入力するだけで3Dの背景全体を作り出せる生成AIを提供する計画を発表した。

本格的に稼働し始めれば、この大人気オンライン・プラットフォームの開発者たちが、たとえば「砂漠のレースコースを生成して」と入力するだけで、人工知能(AI)で指示通りのシーンを作り出せるようになる。ユーザーはまた、「時間帯を日中から夜間に切り替える」「環境を砂漠から森林に変える」といった具合にシーンを修正したり、範囲を拡大したりすることもできる。

ロブロックスでは従来から、クリエイター・スタジオを利用することで、こうしたシーンを手作業で作り出すことが可能だった。だが、新たな生成AIモデルの導入により、こうした変化を一瞬で生み出せるようになると、ロブロックスは説明する。さらに、開発者は最低限の3D作画スキルで、これまで以上に目を見張るようなシーンを構築できるようになるという。なお同社は、このツールがいつリリースされるか、具体的な時期を明かしていない。

ゲーム開発者たちはすでに興奮を隠せない。「机に向かって手作業をする代わりに、別のアプローチを試すことができます」。ロブロックスの主力ゲームタイトルの制作を手掛けるザ・ギャング(The Gang)のマーカス・ホルムストローム最高経営責任者(CEO)は語る。 「たとえば、山を置きたいなら、いくつか違うタイプの山を作り、その場で臨機応変に変更できます。それから細部に手作業で修正を加え、空間に合わせます。大幅な時間の節約になるでしょう」。

ロブロックスの新ツールは、無数のゲーム内世界を構成する3Dブロックを「トークン化」する手法をとっている。これは、個々のブロックを構成単位として扱い、数値を付与するもので、数値はシークエンスの中で次に出現する確率がどの程度かに基づいて決定される。これは、大規模言語モデルが単語や単語の断片を扱う方法に似ている。たとえば、GPT-4のような大規模言語モデルで「フランスの首都は」と入力すると、モデルは次に来る確率がもっとも高いトークンは何かを評価する。当然、ここでは「パリ」になる。ロブロックスのシステムは3Dブロックをこれと同じように扱い、ひとつのブロックの隣にもっとも可能性の高いブロックを並べるという形で、背景環境をつくりだす。

この方法を確立するのは、いくつかの理由から困難だった。第一に、テキストデータに比べて、3D環境のデータははるかに少ない。モデルを訓練するためにロブロックスは、クリエイターが制作したユーザー生成データや、外部のデータセットに頼らなければならなかった。

「高品質な3D情報を手に入れるのは困難でした」と説明するのは、ロブロックスでAI担当副社長を務めるアヌパム・シンだ。「思いつくかぎりのデータセットをすべて入手したとしても、次のブロックを予測するためには、X、Y、Zという3つの次元の情報が必要です」。

3Dデータの不足により、奇妙な状況が生まれることがある。たとえばレースコースのど真ん中に樹が現れるといった具合に、場違いなところに物体が出現するのだ。この問題を回避するため、ロブロックスは第2のAIモデルを利用した。オープンソースデータおよびライセンス取得済みのより豊富な2Dデータを使って訓練したこのモデルを使って、最初のモデルの成果物のチェックをさせたのだ。

基本的な仕組みは、最初のAIモデルが作った3D環境を、第2のAIモデルが2次元画像に落として論理的一貫性があるかどうかを評価するというものだ。画像が意味不明で、たとえば12本の腕をもつネコがレーシングカーを運転している場合は、3DのAIモデルに新たなブロックを作らせ、第2のモデルの「お墨付き」が得られるまで繰り返す。

ロブロックスのゲームデザイナーがお払い箱になるわけではない。数百万人がプレイするプラットフォームに向けて娯楽性の高いゲーム環境を構築するために、彼らは依然として欠かせない。そう指摘するのは、ケント州立大学でアニメーションゲームデザインを教えるクリス・トッテン准教授だ。「多くのジェネレーターが作り出すゲームの環境は、無味乾燥で平坦です。人の手で方向を示してやる必要があるのです。授業の課題の小論文をチャットGPT(ChatGPT)で書こうとする時に起こることに似ています。生成AIはまた、よい環境デザイン、すなわちプレーヤーへの応答性の高い環境デザインとは何かにまつわる議論を活性化させるでしょう」。

Roblox Texture Generator skins a 3d model of a backpack with
ROBLOX

新たなAIツールは、すべてのプロセスへのAIの統合を進めているロブロックスの取り組みの一環だ。同社は現在、250種のAIモデルを運用している。うち1つのAIモデルは、音声チャットをリアルタイムで分析し、適切な発言をスクリーニングして、即座に警告を発し、違反を繰り返した場合は最悪の場合、アカウントを停止する。

ロブロックスは3D基盤モデルのオープンソース化を予定しており、これによりモデルの改良が進み、イノベーションの基礎として活用されることを期待している。「私たちはオープンソースで開発を進めています。競合他社も含め、誰でもこのモデルを利用できます」と、シン副社長は語る。

3D基盤モデルをできるだけ多くの手に行き渡らせることはまた、ロブロックスの環境を創造するスキルが不十分な開発者にも、クリエイティブな可能性を提供することにつながる。「たったひとりで技術を磨いている開発者はたくさんいます。こうした人たちにとっては画期的なツールになるでしょう。共同制作する相手を見つけなくて済むわけですから」とホルムストロームCEOは言う。

人気の記事ランキング
  1. A new US phone network for Christians aims to block porn and gender-related content ポルノもLGBTも遮断、キリスト教徒向けMVNOが米国で登場
  2. Musk v. Altman week 1: Elon Musk says he was duped, warns AI could kill us all, and admits that xAI distills OpenAI’s models 「オープンAIを蒸留した」マスク対アルトマン第1週、法廷がざわめく
  3. Will fusion power get cheap? Don’t count on it. 核融合は本当に安くなるのか? 楽観論に「待った」をかける新研究
スコット・J・マリガン [Scott J Mulligan]米国版 AI担当記者
政策、ガバナンス、AIの内部構造などを取材するAI担当記者。AIに特化した若手ジャーナリスト育成プログラム「ターベル・フェローシップ(Tarbell Fellowship)」の支援を受けている。ヴァイス(VICE)ニュースでのドキュメンタリー映像制作、ビデオゲーム・デザイナーなどを経て現職。
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る