KADOKAWA Technology Review
×
【本日最終日!!】年間サブスク20%オフのお得な【春割】実施中
AudioMook:What will the AI drawing boom bring?

聴くMITTR:「AIお絵描き」ブームは何をもたらすのか?

今週のオーディオ・ムック(β)では、話題の画像生成AIから、マルチモーダルAIの可能性について考える。 by MIT Technology Review Audio Studio2022.08.25

テキストから画像を生成する「AIお絵描きツール」がここ数週間、ネット上で話題になっている。ブームに先鞭をつけたのが、2021年にオープンAI(OpenAI)が発表した「DALL-E(ダリー)」だ。従来のAI技術では、自然言語処理モデルはテキストだけ、画像生成モデルは画像だけといった具合に、1つの処理しかできなかった。両者を結びつけた「マルチモーダル」なAI(MITテクノロジーレビューが2021年の重大技術に選定)は、このブームにとどまらず、今後ますます広がる応用可能性を持っている。

今週のオーディオ・ムック(β)では、話題の画像生成AIからマルチモーダルAIの可能性について考える。

MITテクノロジーレビューは毎週、旬のテーマを設定し、編集部がピックアップした記事を「オーディオ・ムック(β)」として音声化してお届けします。家事や運動をしながら、通勤しながら、手がふさがっていても記事が読める「聴く」MITテクノロジーレビューをお楽しみください。

なお、本コンテンツは音声合成技術で作成しているため、一部お聞き苦しい点があります。ご容赦ください。バックナンバーはこちら。感想は@techreviewjp まで。

今週の収録記事

オープンAI、文章から画像を描く「DALL-E2」を100万人に提供

オープンAIは、文章から画像を生成する「DALL-E 2」のベータ版を100万人に提供する。一部有料化し、生成した画像の商用利用も可能となる。

「馬に乗った宇宙飛行士」——文章から画像を描くAIが驚きの進歩

オープンAIは、与えられた文章から画像を生成するAIシステムの最新版を発表した。「馬に乗った宇宙飛行士」などの文章を入力すると、言葉にできるものなら何でも写真に近い形で生成できるという、驚くべきものだ。

2021重大技術:「マルチモーダル」でAIはもっと柔軟かつ堅牢になる

人間の知能はさまざまな知覚と言語能力の組み合わせから生まれる。こうしたマルチモーダルな手法を用いれば、新しい状況や問題により容易に対処できる堅牢なAIを作り出せる可能性がある。

人気の記事ランキング
  1. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  2. Here’s why we need to start thinking of AI as “normal” AIは「普通」の技術、プリンストン大のつまらない提言の背景
MITテクノロジーレビュー オーディオ・スタジオ [MIT Technology Review Audio Studio]日本版 オーディオ・スタジオ チーム
MITテクノロジーレビューは毎週、旬のテーマを設定し、編集部がピックアップした記事を「オーディオ・ムック(β)」として音声化してお届けします。
▼Promotion
年間購読料 春割20%off
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る