KADOKAWA Technology Review
×
AudioMook:What will the AI drawing boom bring?

聴くMITTR:「AIお絵描き」ブームは何をもたらすのか?

今週のオーディオ・ムック(β)では、話題の画像生成AIから、マルチモーダルAIの可能性について考える。 by MIT Technology Review Audio Studio2022.08.25

テキストから画像を生成する「AIお絵描きツール」がここ数週間、ネット上で話題になっている。ブームに先鞭をつけたのが、2021年にオープンAI(OpenAI)が発表した「DALL-E(ダリー)」だ。従来のAI技術では、自然言語処理モデルはテキストだけ、画像生成モデルは画像だけといった具合に、1つの処理しかできなかった。両者を結びつけた「マルチモーダル」なAI(MITテクノロジーレビューが2021年の重大技術に選定)は、このブームにとどまらず、今後ますます広がる応用可能性を持っている。

今週のオーディオ・ムック(β)では、話題の画像生成AIからマルチモーダルAIの可能性について考える。

MITテクノロジーレビューは毎週、旬のテーマを設定し、編集部がピックアップした記事を「オーディオ・ムック(β)」として音声化してお届けします。家事や運動をしながら、通勤しながら、手がふさがっていても記事が読める「聴く」MITテクノロジーレビューをお楽しみください。

なお、本コンテンツは音声合成技術で作成しているため、一部お聞き苦しい点があります。ご容赦ください。バックナンバーはこちら。感想は@techreviewjp まで。

今週の収録記事

オープンAI、文章から画像を描く「DALL-E2」を100万人に提供

オープンAIは、文章から画像を生成する「DALL-E 2」のベータ版を100万人に提供する。一部有料化し、生成した画像の商用利用も可能となる。

「馬に乗った宇宙飛行士」——文章から画像を描くAIが驚きの進歩

オープンAIは、与えられた文章から画像を生成するAIシステムの最新版を発表した。「馬に乗った宇宙飛行士」などの文章を入力すると、言葉にできるものなら何でも写真に近い形で生成できるという、驚くべきものだ。

2021重大技術:「マルチモーダル」でAIはもっと柔軟かつ堅牢になる

人間の知能はさまざまな知覚と言語能力の組み合わせから生まれる。こうしたマルチモーダルな手法を用いれば、新しい状況や問題により容易に対処できる堅牢なAIを作り出せる可能性がある。

人気の記事ランキング
  1. AI models can outperform humans in tests to identify mental states AIが「心の理論」テストで人間超え、この結果は何を意味するか
  2. Promotion Announcement from the MIT Club of Japan お知らせ:日本MIT会、全国5カ所でSTEAMワークショップ
  3. Why EV charging needs more than Tesla EVシフト、充電部門閉鎖で明らかになった「テスラ頼み」の危うさ
  4. The way whales communicate is closer to human language than we realized クジラの言語構造、想像以上に人間の言語に近かった
MITテクノロジーレビュー オーディオ・スタジオ [MIT Technology Review Audio Studio]日本版 オーディオ・スタジオ チーム
MITテクノロジーレビューは毎週、旬のテーマを設定し、編集部がピックアップした記事を「オーディオ・ムック(β)」として音声化してお届けします。
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
人気の記事ランキング
  1. AI models can outperform humans in tests to identify mental states AIが「心の理論」テストで人間超え、この結果は何を意味するか
  2. Promotion Announcement from the MIT Club of Japan お知らせ:日本MIT会、全国5カ所でSTEAMワークショップ
  3. Why EV charging needs more than Tesla EVシフト、充電部門閉鎖で明らかになった「テスラ頼み」の危うさ
  4. The way whales communicate is closer to human language than we realized クジラの言語構造、想像以上に人間の言語に近かった
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る