Roblox is launching a generative AI that builds 3D environments in a snap

ロブロックス、プロンプトから3D環境を自動生成するAI提供へ

人気オンラインゲーム・プラットフォームのロブロックスが、3Dゲーム環境を構築できる生成AIを開発。プロンプトから背景を生成し、ゲーム開発者の負担を軽減する。 by Scott J Mulligan2024.09.11

この記事の3つのポイント

ロブロックスがテキスト入力で3D背景を生成するAIを提供する計画を発表
AIモデルは3Dブロックをトークン化し確率に基づいて背景環境を構築する
ロブロックスは3D基盤モデルのオープンソース化を予定している

summarized by Claude 3

オンラインゲーム・プラットフォームのロブロックス（Roblox）は9月6日、クリエイターがテキスト・プロンプト（指示テキスト）を入力するだけで3Dの背景全体を作り出せる生成AIを提供する計画を発表した。

本格的に稼働し始めれば、この大人気オンライン・プラットフォームの開発者たちが、たとえば「砂漠のレースコースを生成して」と入力するだけで、人工知能（AI）で指示通りのシーンを作り出せるようになる。ユーザーはまた、「時間帯を日中から夜間に切り替える」「環境を砂漠から森林に変える」といった具合にシーンを修正したり、範囲を拡大したりすることもできる。

ロブロックスでは従来から、クリエイター・スタジオを利用することで、こうしたシーンを手作業で作り出すことが可能だった。だが、新たな生成AIモデルの導入により、こうした変化を一瞬で生み出せるようになると、ロブロックスは説明する。さらに、開発者は最低限の3D作画スキルで、これまで以上に目を見張るようなシーンを構築できるようになるという。なお同社は、このツールがいつリリースされるか、具体的な時期を明かしていない。

ゲーム開発者たちはすでに興奮を隠せない。「机に向かって手作業をする代わりに、別のアプローチを試すことができます」。ロブロックスの主力ゲームタイトルの制作を手掛けるザ・ギャング（The Gang）のマーカス・ホルムストローム最高経営責任者（CEO）は語る。「たとえば、山を置きたいなら、いくつか違うタイプの山を作り、その場で臨機応変に変更できます。それから細部に手作業で修正を加え、空間に合わせます。大幅な時間の節約になるでしょう」。

ロブロックスの新ツールは、無数のゲーム内世界を構成する3Dブロックを「トークン化」する手法をとっている。これは、個々のブロックを構成単位として扱い、数値を付与するもので、数値はシークエンスの中で次に出現する確率がどの程度かに基づいて決定される。これは、大規模言語モデルが単語や単語の断片を扱う方法に似ている。たとえば、GPT-4のような大規模言語モデルで「フランスの首都は」と入力すると、モデルは次に来る確率がもっとも高いトークンは何かを評価する。当然、ここでは「パリ」になる。ロブロックスのシステムは3Dブロックをこれと同じように扱い、ひとつのブロックの隣にもっとも可能性の高いブロックを並べるという形で、背景環境をつくりだす。

この方法を確立するのは、いくつかの理由から困難だった。第一に、テキストデータに比べて、3D環境のデータははるかに少ない。モデルを訓練するためにロブロックスは、クリエイターが制作したユーザー生成データや、外部のデータセットに頼らなければならなかった。

「高品質な3D情報を手に入れるのは困難でした」と説明するのは、ロブロックスでAI担当副社長を務めるアヌパム・シンだ。「思いつくかぎりのデータセットをすべて入手したとしても、次のブロックを予測するためには、X、Y、Zという3つの次元の情報が必要です」。

3Dデータの不足により、奇妙な状況が生まれることがある。たとえばレースコースのど真ん中に樹が現れるといった具合に、場違いなところに物体が出現するのだ。この問題を回避するため、ロブロックスは第2のAIモデルを利用した。オープンソースデータおよびライセンス取得済みのより豊富な2Dデータを使って訓練したこのモデルを使って、最初のモデルの成果物のチェックをさせたのだ。

基本的な仕組みは、最初のAIモデルが作った3D環境を、第2のAIモデルが2次元画像に落として論理的一貫性があるかどうかを評価するというものだ。画像が意味不明で、たとえば12本の腕をもつネコがレーシングカーを運転している場合は、3DのAIモデルに新たなブロックを作らせ、第2のモデルの「お墨付き」が得られるまで繰り返す。

ロブロックスのゲームデザイナーがお払い箱になるわけではない。数百万人がプレイするプラットフォームに向けて娯楽性の高いゲーム環境を構築するために、彼らは依然として欠かせない。そう指摘するのは、ケント州立大学でアニメーションゲームデザインを教えるクリス・トッテン准教授だ。「多くのジェネレーターが作り出すゲームの環境は、無味乾燥で平坦です。人の手で方向を示してやる必要があるのです。授業の課題の小論文をチャットGPT（ChatGPT）で書こうとする時に起こることに似ています。生成AIはまた、よい環境デザイン、すなわちプレーヤーへの応答性の高い環境デザインとは何かにまつわる議論を活性化させるでしょう」。

Roblox Texture Generator skins a 3d model of a backpack with — ROBLOX

新たなAIツールは、すべてのプロセスへのAIの統合を進めているロブロックスの取り組みの一環だ。同社は現在、250種のAIモデルを運用している。うち1つのAIモデルは、音声チャットをリアルタイムで分析し、適切な発言をスクリーニングして、即座に警告を発し、違反を繰り返した場合は最悪の場合、アカウントを停止する。

ロブロックスは3D基盤モデルのオープンソース化を予定しており、これによりモデルの改良が進み、イノベーションの基礎として活用されることを期待している。「私たちはオープンソースで開発を進めています。競合他社も含め、誰でもこのモデルを利用できます」と、シン副社長は語る。

3D基盤モデルをできるだけ多くの手に行き渡らせることはまた、ロブロックスの環境を創造するスキルが不十分な開発者にも、クリエイティブな可能性を提供することにつながる。「たったひとりで技術を磨いている開発者はたくさんいます。こうした人たちにとっては画期的なツールになるでしょう。共同制作する相手を見つけなくて済むわけですから」とホルムストロームCEOは言う。

人気の記事ランキング

スコット・J・マリガン [Scott J Mulligan]米国版 AI担当記者: 政策、ガバナンス、AIの内部構造などを取材するAI担当記者。AIに特化した若手ジャーナリスト育成プログラム「ターベル・フェローシップ（Tarbell Fellowship）」の支援を受けている。ヴァイス（VICE）ニュースでのドキュメンタリー映像制作、ビデオゲーム・デザイナーなどを経て現職。