KADOKAWA Technology Review
×
AIのための「フェイク人間」が大量生産される時代がやってきた
Courtesy of Datagen
人工知能(AI) 無料会員限定
These creepy fake humans herald a new age in AI

AIのための「フェイク人間」が大量生産される時代がやってきた

機械学習システムの訓練用にデータを大量に入手することは、プライバシー保護の観点から困難になっているうえ、現実のデータには偏りが存在する可能性がある。そこで、AIシステム訓練用のフェイクデータセットを現実のデータに基づいて作成し、AIシステムベンダーに提供する企業が現れている。 by Karen Hao2021.06.15

上唇にはかすかに無精ひげが生え、額にはしわが入り、皮膚にはシミがあるのが見て取れる。だが、この男性は実在する人間ではない。データジェン(Datagen)が実在の人物を模倣するために作ったフェイク・ヒューマンなのだ。同社は、このように人間をシミュレーションしたフェイク・ヒューマンを数十万体も作成・販売している。

これらのフェイク・ヒューマンは、ゲーム用のアバターでもなければ、映画のためのアニメキャラクターでもない。深層学習アルゴリズム開発者からの増大するニーズに応えるべく設計された合成データだ。同アルゴリズムの訓練用の実世界のデータを収集するプロセスには費用も時間もかかるが、データジェンをはじめとする企業は、それに代わる魅力的な方法を提供している。顧客のために、顧客が望むように、顧客が必要なときに比較的安い料金でデータを生成できるのだ。

フェイク・ヒューマンを生成するにあたって、データジェンは最初に実際の人間をスキャンする。人工知能(Ai)システムのベンダーが、人々に代金を支払って巨大な全身スキャナーの中に入ってもらい、虹彩から肌の質感、指の曲がり具合に至るまで、あらゆる詳細なデータを取り込む。データジェンがその生データに一連のアルゴリズムを適用すると、人物の胴体や顔、目、手の3次元モデルが作成される仕組みである。

イスラエルを拠点とするデータジェンは、すでに米国の大手テック企業4社と協業していると述べているが、それがどこかは明らかにしていない。データジェンに最も近い競合他社であるシンセシス・エーアイ(Synthesis AI)も、オンデマンドのデジタル・ヒューマンを提供している。ほかに、金融、保険、ヘルスケアなどの分野で使用されるデータを生成している企業もある。 データの種類と同程度の数の合成データ作成企業が存在しているのだ。

合成データはかつて、実際のデータに劣ると見なされていた。だが、今ではオールマイティな解決策になると考えている人々もいる。実際のデータは乱雑で、偏っているうえに、新たなデータプライバシー規制により、収集が難しくなっている。それとは対照的に、合成データは純粋な存在であり、より多様なデータセットを構築するのに使用できる。たとえば、さまざまな年齢、骨格、民族などのラベル付けが完全にされた顔を数多く作成して、人種を問わずに機能する顔認識システムを構築することもできる。

しかし、合成データには限界がある。現実を反映することに失敗した場合、乱雑で偏った現実世界のデータを使う場合より劣悪なAIを生成する可能性があるのだ。もしくは、単に現実と同じ問題を引き継ぐ可能性もある。データサイエンティストであり、アルゴリズムを監査する企業、オルカー(ORCAA)の創業者であるキャシー・オニールは、「このパラダイムを歓迎して、『ああ、これで多くの問題が解決する』などと言いたくはありません」と語る。「なぜなら、合成データを使うことで多くのものを無視することになるからです」。

「現実的」だが、「現実」ではない

深層学習にとって、データは常に重要な存在だった。しかし、この数年間で、AIのコミュニティは良質なデータのほうがビッグデータよりも重要であることを学んだ。量が少なくても、きれいにラベル付けされた適切なデータのほうが、整理されていない10倍の量のデータやより高度なアルゴリズムよりも、AIシステムのパフォーマンスを向上させられるのだ。

データジェンのCEO(最高経営責任者)兼共同創業者であるオフィール・チャコンは、これにより、企業がAIモデルの開発に取り組む方法が変わると主張している。現在、各企業はできるだけ多くのデータを取得してから、パフォーマンスを向上するためにアルゴリズムに手を加え、調整している。だが、本来望ましいのはその反対のことである。すなわち、使用するアルゴリズムは一定で、訓練用データの構成のほうを改善していくべきだという。

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. An ancient man’s remains were hacked apart and kept in a garage 切り刻まれた古代人、破壊的発掘から保存重視へと変わる考古学
  2. This startup just hit a big milestone for green steel production グリーン鉄鋼、商業化へ前進 ボストン・メタルが1トンの製造に成功
  3. AI reasoning models can cheat to win chess games 最新AIモデル、勝つためなら手段選ばず チェス対局で明らかに
  4. OpenAI has released its first research into how using ChatGPT affects people’s emotional wellbeing チャットGPTとの対話で孤独は深まる? オープンAIとMITが研究
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る