KADOKAWA Technology Review
×
発表!MITテクノロジーレビューが選ぶ
2022年のイノベーター14人。
【12/15 Summit開催】
アニメ絵に強いバイドゥの画像生成AI、中国ならではの弱み
Ms Tech | Getty, Envato
知性を宿す機械 無料会員限定
There’s no Tiananmen Square in the new Chinese image-making AI

アニメ絵に強いバイドゥの画像生成AI、中国ならではの弱み

バイドゥが開発したテキストから画像を生成するAI「ERNIE-ViLG」は、中国固有の文化に基づく物やアニメキャラ風の画像生成において、既存のAIよりも優れている。しかし、検閲機能によって、政治的にセンシティブな言葉は排除される。 by Zeyi Yang2022.09.26

テキストから画像を生成する新たな人工知能(AI)が登場した。中国のテック企業であるバイドゥが開発した画像生成AI「ERNIE-ViLG(アーニーViLG)」 は、中国特有の文化に根ざした画像を生成できるうえ、アニメ風キャラの画像生成においても、オープンAI(OpenAI)の「DALL-E 2(ダリー2)」をはじめとする欧米の画像生成AIを凌ぐ。

だが、中国第2の都市である北京にあり、政治の象徴的な中心地となっている天安門広場など、AIが画像を生成しない題材もたくさんある。

今年8月下旬にERNIE-ViLGのデモが公開されると、ユーザーたちはすぐに、特定の言葉が「センシティブ」とされ、画像が生成されないことに気づいた。政治指導者の名前が直接的に使われている言葉や、政治的な文脈でのみ話題になり得る言葉などだ。中国の高度なオンライン検閲システムは、どうやらAIの最新トレンドにも及んでいるようだ。

もっとも、特定のコンテンツを生成できないように制限している画像生成AIはめずしくない。DALL-E 2では、性的コンテンツ、公人の顔、医療行為の画像の生成は禁止されている。しかし、ERNIE-ViLGの場合は、モデレーションと政治的検閲の正確な境界線がどこにあるのかという問題を浮き彫りにしている。

ERNIE-ViLGのモデルは、バイドゥの自然言語処理の大規模プロジェクト「ウェン・シン(Wenxin)」の成果の一部を利用している。1億4500万組の画像とテキストのデータセットで訓練され、コンセプトやアートスタイルの微妙な違いを見分けるために、100億個のパラメーター(ニューラル・ネットワークが学習する際に調整する値)を組み込んでいる。ERNIE-ViLGの訓練用データセットは、DALL-E 2の6億5000万組や「ステーブル・フュージョン(Stable Diffusion)」の23億組よりも少ないが、パラメーターは両者よりも多い(DALL-E 2のパラメーターは35億、Stable Diffusionは8億9000万)。バイドゥは8月下旬に自社プラットフォームでデモ版を公開し、のちに国際的なAIコミュニティとして人気の高いハギング・フェイス(Hugging Face)で公開した。

ERNIE-ViLGと欧米のモデルの主な違いは、バイドゥが開発したモデルは中国語で書かれたプロンプトを理解し、文化的に特異な単語に関しては間違いが少ないということだ。

例えば、中国の映像クリエイターは、中国の歴史上の人物、ポップカルチャーの有名人、食品を含むプロンプトについて、さまざまなモデルが生成した画像を比較した。その結果、ERNIE-ViLGは、DALL-E 2やステーブル・ディフュージョンよりも正確な画像を生成するこ …

バイドゥが開発したテキストから画像を生成するAI「ERNIE-ViLG」は、中国固有の文化に基づく物やアニメキャラ風の画像生成において、既存のAIよりも優れている。しかし、検閲機能によって、政治的にセンシティブな言葉は排除される。
こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
MITテクノロジーレビュー[日本版] Vol.8
MITテクノロジーレビュー[日本版] Vol.8脱炭素イノベーション

2050年のカーボンニュートラル(炭素中立)の実現に向けて、世界各国で研究開発が加速する脱炭素技術、社会実装が進む気候変動の緩和・適応策などGX(グリーン・トランスフォーメーション)の最新動向を丸ごと1冊取り上げる。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る