KADOKAWA Technology Review
×
【春割】実施中!年間購読料20%オフ!
オープンAIが「Sora」を一般公開、最長20秒の動画を生成
OpenAi
How to use Sora, OpenAI’s new video generating tool

オープンAIが「Sora」を一般公開、最長20秒の動画を生成

オープンAIは、テキストから動画を生成するAIモデル「Sora(ソラ)」の一般提供を開始した。チャットGPTの有料版ユーザーが利用可能で、月額200ドルのプランでは最長20秒までの動画の生成に対応する。 by James O'Donnell2024.12.10

この記事の3つのポイント
  1. オープンAIが動画生成AI「ソラ(Sora)」を一般公開した
  2. ソラはテキストから動画生成やリミックスなどが可能である
  3. 各社から動画生成AIの発表が続くが、悪用防止策や環境負荷などの課題も
summarized by Claude 3

オープンAI(OpenAI)は今日、動画生成モデル「ソラ(Sora)」を一般公開した。この発表は、新製品のリリースとデモが続く12日間のイベント「シップマス(shipmas)」の5日目に行なわれた。この記事では、Soraに関する基本情報と、すぐに使い始める方法を紹介する。

Soraとは?

Soraは、テキスト・プロンプトから動画を生成したり、画像をアニメーション化したり、動画を新しいスタイルでリミックスしたりできるAI動画生成モデルである。オープンAIは2月にこのモデルのプレビューを発表したが、今回初めて広く利用可能となった。

今回のリリースにおける新要素は?

Soraの基本機能(シンプルなプロンプトで動画を作成)は2月にプレビューされたものと変わらないが、今回のリリースでは速度とコストの改善が図られている。また、いくつかの新機能も追加されている。特に「ストーリーボード」と「フィード」は注目の新機能だ。

ストーリーボードは、複数のAI生成動画をタイムライン上で組み合わせ、1つの動画にまとめる機能である。従来の動画編集ソフト、例えばアドビ・プレミアプロ(Adobe Premiere Pro)に近い操作が可能だ。

フィードは、クリエイティブな作品の共有やインスピレーションの提供を目的としたギャラリー機能である。ユーザーはSoraで生成した動画を投稿したり、他の動画の作成プロンプトを確認・微調整したりできる。

Soraで何ができるのか?

Soraを使用することで、テキスト・プロンプトから動画を生成したり、「リミックス」というツールを使って動画のスタイルや要素を変更したりできる。さらに、前述の「ストーリーボード」機能を活用して複数のクリップを組み合わせて1本の動画に仕上げることも可能だ。また、Soraにはムーディーなフィルム・ノワールやストップ・モーション風のダンボールやペーパークラフトなど、いくつかのプリセットスタイルが用意されており、それらを動画に適用できる。作成した動画をトリミングしたりループに設定したりすることも可能だ。

誰が使える?

Soraを使うためには、オープンAIのプレミアム・プランのいずれかを購読する必要がある。チャットGPTプラス(月額20ドル)またはチャットGPTプロ(月額200ドル)のどちらかである。どちらのプランにも、他のオープンAI製品へのアクセスが含まれている。プラスのユーザーは最大720pの解像度で、長さ5秒までの動画を生成でき、月50本までという制限がある。一方、プロのユーザーは1080pの解像度で最大20秒の動画を生成でき、1回のプロンプトから最大5つのバリエーション動画を生成可能だ。プロのユーザーは月500本までという制限があるが、順番待ちリストに登録してサイトのトラフィックが少ない時に動画を生成させる「リラックス」モードは無制限だ。

どちらのプランでも、縦長、横長、正方形の3つのアスペクト比で動画を生成することが可能だ。一方、プランに加入していないユーザーは、Soraで生成された動画を閲覧するフィード機能のみ利用できる。

オープンAIは今日からSoraのグローバルで展開を開始しているが、同社によれば「欧州の大部分」では展開にもう少し時間がかかるとしている。

どこでアクセスできる?

SoraはチャットGPTとは独立したサービスとして提供されており、アクセスするにはSora.comに移動してチャットGPTプラスまたはプロのアカウントでログインする。ただし、本記事の公開時点ではアクセスが集中し、新規登録は一時停止されている。

これまでの経緯は?

Soraが初公開された2月以降、他のテック企業も動画生成ツールを次々と発表している。メタのムービー・ジェン(MovieGen)グーグルのベオ(Veo)などだ。一方で、反発の声も多い。オープンAIがSoraをアーティストの作品を訓練データとして使用しながら報酬を支払っていない点に抗議し、Soraの早期アクセス権を提供されたアーティストの一部がツールをリークする事態も発生している。

今後の展開は?

新しいモデルがリリースされるたびに問題となるのは、その悪用である。例えば、ディープフェイクやその他違法・非倫理的な目的で使用される可能性が懸念されるが、オープンAIがどのような措置を講じたのかは、現時点ではまだ分かっていない。オープンAIのある従業員はモデレーションと安全性について、「初日から完璧ではないかもしれない」と述べている。

また、Soraによる動画生成は、チャットGPTのようなテキスト生成と比較してはるかに多くの計算能力とエネルギーを消費する。AIブームですでに大量のエネルギーが消費されており、温暖化ガス排出量の抑制を目指すテック企業各社は課題を突きつけられている。Soraなどの動画モデルが広く利用可能になることで、問題がさらに悪化する可能性がある。

人気の記事ランキング
  1. A new US phone network for Christians aims to block porn and gender-related content ポルノもLGBTも遮断、キリスト教徒向けMVNOが米国で登場
  2. Musk v. Altman week 1: Elon Musk says he was duped, warns AI could kill us all, and admits that xAI distills OpenAI’s models 「オープンAIを蒸留した」マスク対アルトマン第1週、法廷がざわめく
  3. Will fusion power get cheap? Don’t count on it. 核融合は本当に安くなるのか? 楽観論に「待った」をかける新研究
ジェームス・オドネル [James O'Donnell]米国版 AI/ハードウェア担当記者
自律自動車や外科用ロボット、チャットボットなどのテクノロジーがもたらす可能性とリスクについて主に取材。MITテクノロジーレビュー入社以前は、PBSの報道番組『フロントライン(FRONTLINE)』の調査報道担当記者。ワシントンポスト、プロパブリカ(ProPublica)、WNYCなどのメディアにも寄稿・出演している。
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る