KADOKAWA Technology Review
×
「Innovators Under 35 Japan」2024年度候補者募集中!
AIのための「フェイク人間」が大量生産される時代がやってきた
Courtesy of Datagen
人工知能(AI) 無料会員限定
These creepy fake humans herald a new age in AI

AIのための「フェイク人間」が大量生産される時代がやってきた

機械学習システムの訓練用にデータを大量に入手することは、プライバシー保護の観点から困難になっているうえ、現実のデータには偏りが存在する可能性がある。そこで、AIシステム訓練用のフェイクデータセットを現実のデータに基づいて作成し、AIシステムベンダーに提供する企業が現れている。 by Karen Hao2021.06.15

上唇にはかすかに無精ひげが生え、額にはしわが入り、皮膚にはシミがあるのが見て取れる。だが、この男性は実在する人間ではない。データジェン(Datagen)が実在の人物を模倣するために作ったフェイク・ヒューマンなのだ。同社は、このように人間をシミュレーションしたフェイク・ヒューマンを数十万体も作成・販売している。

これらのフェイク・ヒューマンは、ゲーム用のアバターでもなければ、映画のためのアニメキャラクターでもない。深層学習アルゴリズム開発者からの増大するニーズに応えるべく設計された合成データだ。同アルゴリズムの訓練用の実世界のデータを収集するプロセスには費用も時間もかかるが、データジェンをはじめとする企業は、それに代わる魅力的な方法を提供している。顧客のために、顧客が望むように、顧客が必要なときに比較的安い料金でデータを生成できるのだ。

フェイク・ヒューマンを生成するにあたって、データジェンは最初に実際の人間をスキャンする。人工知能(Ai)システムのベンダーが、人々に代金を支払って巨大な全身スキャナーの中に入ってもらい、虹彩から肌の質感、指の曲がり具合に至るまで、あらゆる詳細なデータを取り込む。データジェンがその生データに一連のアルゴリズムを適用すると、人物の胴体や顔、目、手の3次元モデルが作成される仕組みである。

イスラエルを拠点とするデータジェンは、すでに米国の大手テック企業4社と協業していると述べているが、それがどこかは明らかにしていない。データジェンに最も近い競合他社であるシンセシス・エーアイ(Synthesis AI)も、オンデマンドのデジタル・ヒューマンを提供している。ほかに、金融、保険、ヘルスケアなどの分野で使用されるデータを生成している企業もある。 データの種類と同程度の数の合成データ作成企業が存在しているのだ。

合成データはかつて、実際のデータに劣ると見なされていた。だが、今ではオールマイティな解決策になると考えている人々もいる。実際のデータは乱雑で、偏っているうえに、新たなデータプライバシー規制により、収集が難しくなっている。それとは対照的に、合成データは純粋な存在であり、より多様なデータセットを構築するのに使用できる。たとえば、さまざまな年齢、骨格、民族などのラベル付けが完全にされた顔を数多く作成して、人種を問わずに機能する顔認識システムを構築することもできる。

しかし、合成データには限界がある。現実を反映することに失敗した場合、乱雑で偏った現実世界のデータを使う場合より劣悪なAIを生成する可能性があるのだ。もしくは、単に現実と同じ問題を引き継ぐ可能性もある。データサイエンティストであり、アルゴリズムを監査する企業、オルカー(ORCAA)の創業者であるキャシー・オニールは、「このパラダイムを歓迎して、『ああ、これで多くの問題が解決する』などと言いたくはありません」と語る。「なぜなら、合成データを使うことで多くのものを無視することになるからです」。

「現実的」だが、「現実」ではない

深層学習にとって、データは常に重要な存在だった。しかし、この数年間で、AIのコミュニティは良質なデータのほうがビッグデータよりも重要であることを学んだ。量が少なくても、きれいにラベル付けされた適切なデータのほうが、整理されていない10倍の量のデータやより高度なアルゴリズムよりも、AIシステムのパフォーマンスを向上させられるのだ。

データジェンのCEO(最高経営責任者)兼共同創業者であるオフィール・チャコンは、これにより、企業がAIモデルの開発に取り組む方法が変わると主張している。現在、各企業はできるだけ多くのデータを取得してから、パフォーマンスを向上するためにアルゴリズムに手を加え、調整している。だが、本来望ましいのはその反対のことである。すなわち、使用するアルゴリズムは一定で、訓練用データの構成のほうを改善していくべきだという。

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. AI can make you more creative—but it has limits 生成AIは人間の創造性を高めるか? 新研究で限界が明らかに
  2. Promotion Call for entries for Innovators Under 35 Japan 2024 「Innovators Under 35 Japan」2024年度候補者募集のお知らせ
  3. Interview with Prof. Masayuki Ohzeki: The Future of Quantum Computer Commercialization and the Qualities of Innovators 量子技術を最速で社会へ、大関真之教授が考えるイノベーターの条件
  4. Robot-packed meals are coming to the frozen-food aisle 「手作業が早い」食品工場でもロボット化、盛り付け完璧に
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年も候補者の募集を開始しました。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る