KADOKAWA Technology Review
×
AIのための「フェイク人間」が大量生産される時代がやってきた
Courtesy of Datagen
人工知能(AI) 無料会員限定
These creepy fake humans herald a new age in AI

AIのための「フェイク人間」が大量生産される時代がやってきた

機械学習システムの訓練用にデータを大量に入手することは、プライバシー保護の観点から困難になっているうえ、現実のデータには偏りが存在する可能性がある。そこで、AIシステム訓練用のフェイクデータセットを現実のデータに基づいて作成し、AIシステムベンダーに提供する企業が現れている。 by Karen Hao2021.06.15

上唇にはかすかに無精ひげが生え、額にはしわが入り、皮膚にはシミがあるのが見て取れる。だが、この男性は実在する人間ではない。データジェン(Datagen)が実在の人物を模倣するために作ったフェイク・ヒューマンなのだ。同社は、このように人間をシミュレーションしたフェイク・ヒューマンを数十万体も作成・販売している。

これらのフェイク・ヒューマンは、ゲーム用のアバターでもなければ、映画のためのアニメキャラクターでもない。深層学習アルゴリズム開発者からの増大するニーズに応えるべく設計された合成データだ。同アルゴリズムの訓練用の実世界のデータを収集するプロセスには費用も時間もかかるが、データジェンをはじめとする企業は、それに代わる魅力的な方法を提供している。顧客のために、顧客が望むように、顧客が必要なときに比較的安い料金でデータを生成できるのだ。

フェイク・ヒューマンを生成するにあたって、データジェンは最初に実際の人間をスキャンする。人工知能(Ai)システムのベンダーが、人々に代金を支払って巨大な全身スキャナーの中に入ってもらい、虹彩から肌の質感、指の曲がり具合に至るまで、あらゆる詳細なデータを取り込む。データジェンがその生データに一連のアルゴリズムを適用すると、人物の胴体や顔、目、手の3次元モデルが作成される仕組みである。

イスラエルを拠点とするデータジェンは、すでに米国の大手テック企業4社と協業していると述べているが、それがどこかは明らかにしていない。データジェンに最も近い競合他社であるシンセシス・エーアイ(Synthesis AI)も、オンデマンドのデジタル・ヒューマンを提供している。ほかに、金融、保険、ヘルスケアなどの分野で使用されるデータを生成している企業もある。 データの種類と同程度の数の合成データ作成企業が存在しているのだ。

合成データはかつて、実際のデータに劣ると見なされていた。だが、今ではオールマイティな解決策になると考えている人々もいる。実際のデータは乱雑で、偏っているうえに、新たなデータプライバシー規制により、収集が難しくなっている。それとは対照的に、合成データは純粋な存在であり、より多様なデータセットを構築するのに使用できる。たとえば、さまざまな年齢、骨格、民族などのラベル付けが完全にされた顔を数多く作成して、人種を問わずに機能する顔認識システムを構築することもできる。

しかし、合成データには限界がある。現実を反映することに失敗した場合、乱雑で偏った現実世界のデータを使う場合より劣悪なAIを生成する可能性があるのだ。もしくは、単に現実と同じ問題を引き継ぐ可能性もある。データサイエンティストであり、アルゴリズムを監査する企業、オルカー(ORCAA)の創業者であるキャシー・オニールは、「このパラダイムを歓迎して、『ああ、これで多くの問題が解決する』などと言いたくはありません」と語る。「なぜなら、合成データを使うことで多くのものを無視することになるからです」。

「現実的」だが、「現実」ではない

深層学習にとって、データは常に重要な存在だった。しかし、この数年間で、AIのコミュニティは良質なデータのほうがビッグデータよりも重要であることを学んだ。量が少なくても、きれいにラベル付けされた適切なデータのほうが、整理されていない10倍の量のデータやより高度なアルゴリズムよりも、AIシステムのパフォーマンスを向上させられるのだ。

データジェンのCEO(最高経営責任者)兼共同創業者であるオフィール・チャコンは、これにより、企業がAIモデルの開発に取り組む方法が変わると主張している。現在、各企業はできるだけ多くのデータを取得してから、パフォーマンスを向上するためにアルゴリズムに手を加え、調整している。だが、本来望ましいのはその反対のことである。すなわち、使用するアルゴリズムは一定で、訓練用データの構成のほうを改善していくべきだという。

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. OpenAI says ChatGPT treats us all the same (most of the time) 相手の名前で回答が変わる?チャットGPTに潜むバイアス明らかに
  2.  A data bottleneck is holding AI science  back, says new Nobel winner ノーベル受賞者・ベイカー教授が指摘する「AI科学」の課題
  3. Trajectory of U35 Innovators: Hiroki Matsunaga 松永浩貴:「枠を超えた発想」が生み出す革新的なロケット推進剤
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者は11月発表予定です。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る