KADOKAWA Technology Review
×
AIに創造性を吹き込む「GAN」とはどんなテクノロジーか?
Nvidia
Inside the world of AI that forges beautiful art and terrifying deepfakes

AIに創造性を吹き込む「GAN」とはどんなテクノロジーか?

敵対的生成ネットワーク(GAN)はAIの創造性を伸長させると同時に、ある種の「危うさ」をもたらしている。その基礎となる考え方を紹介しよう。 by Karen Hao2018.12.07

この3週間、MITテクノロジーレビューは人工知能(AI)の基本を紹介してきた(関連記事1関連記事2)。以下に要約する。

  • AIの進歩と応用のほとんどが、データのパターンを見つけて再適用する、機械学習と呼ばれる種類のアルゴリズムに基づいている
  • 機械学習の強力なサブセットである深層学習は、ニューラル・ネットワークを使用して最小のパターンさえも見つけ、それを増幅する
  • ニューラル・ネットワークとは単純な計算ノード層で、複数のノードが同時に働いてデータを分析する。人間の脳内のニューロンのようなものだと考えればよい

 

さて、お楽しみはここからだ。ニューラル・ネットワークを1つ使用すると、パターンを学習するのにとても役立つ。そしてこれを2つ使用すると、パターンを作り上げるのに素晴らしく役立つのだ。「GAN(Generative Adversarial Network)」と呼ばれる敵対的生成ネットワークの、不思議で恐ろしい世界を紹介しよう。

GANは現在、文化面でちょっとした話題になっている。AIによって制作された芸術作品として初めてクリスティーズ(Christie’s)で競売された作品に関わっているのがGANなのだ。さらに「ディープフェイク」と呼ばれる、一連のニセ物のデジタル画像の背後にもGANが存在する。

GANの秘密は、2つのニューラル・ネットワークが協働して、というよりむしろ敵対しながら作用することにある。まず、両方のニューラル・ネットワークに訓練データをたくさん与え、それぞれのネットワークに別々のタスクを与える。生成器(generator)と呼ばれる最初のネットワークは、訓練例を見て模倣することによって、手書き文字や動画、音声といった人工的な出力を生成する。次に、識別器(discriminator )と呼ばれる第2のネットワークは、各出力を生成ネットワークと同じ訓練例と比較し、その出力が本物がどうかを判定する。

識別器が生成器の出力の却下に成功するたびに、生成器はまた最初からやり直そうとする。MITテクノロジーレビューのサンフランシスコ支局長マーティン・ジャイルズのたとえを借りると、このプロセスは「互いに出し抜こうと繰り返し試みる絵の贋作師と鑑定士のやり取りを真似て」いる。最終的に識別器は出力と訓練例との違いが分からなくなってしまう。言い換えると、模倣と現実の見分けがつかなくなるのだ。

GANの存在する世界が美しくもあり、醜くくもある理由がこれでお分かりだと思う。一方ではメディアを合成したり他のデータ・パターンを模倣したりできる能力が、写真の編集やアニメーション、さらには医学(医用画像の画質改善や、患者のデータ不足を克服するなど)の分野で役に立つかもしれない。また、このような楽しい作品も見られるようになる。

これも、そうだ。

だがその一方で、GANを倫理的に好ましくない方法や、危険な方法で使おうという人も出てくるかもしれず、そうした能力を示したニューヨーク大学とミシガン州の研究者チームの論文も最近発表された。たとえば、ポルノスターの顔の上に有名人の顔を重ねたり、バラク・オバマに何でも好きなことを言わせる、あるいは他人の指紋やその他の生体データを偽造するといったことだ。

幸いなことに、GANの能力にはまだ限度があり、ある程度はガード・レール代わりになっている。GANが本当に信じられるようなものを生み出すには、相当な計算能力と狭い範囲のデータが必要となる。たとえば、GANが本物そっくりのカエルの画像を生成するには、特定の種の、できれば同じ方向を向いたカエルの画像が大量に必要となる。このように細かく指定しなければ、まるで最悪な悪夢に出てくるこの生き物のように、本当に不気味な結果を招いてしまう。

(クモを見せないことに感謝してね)。

だが専門家たちは、私たちが目にしているのはまだ氷山の一角にすぎないと危惧している。アルゴリズムがますます洗練されるにつれ、動きのおかしい動画やピカソの絵に出てくるような動物は過去のものとなるだろう。デジタル画像フォレンジック(鑑定)の専門家であるハニー・ファリド教授(ダートマス大学)が以前話しているように、私たちはこの問題を解決する準備が十分にできていないのだ。

人気の記事ランキング
  1. The problems with Elon Musk’s plan to open source the Twitter algorithm Eマスクがツイッター買収でぶち上げたオープンソース化が危うい理由
  2. Meta has built a massive new language AI—and it’s giving it away for free メタ、「GPT-3並み」の大規模言語モデルを研究者向けに無償提供
  3. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
  4. These hackers showed just how easy it is to target critical infrastructure 発電所も使う通信プロトコルのハッキング、わずか2日で攻略
カーレン・ハオ [Karen Hao]米国版 AI担当記者
MITテクノロジーレビューの人工知能(AI)担当記者。特に、AIの倫理と社会的影響、社会貢献活動への応用といった領域についてカバーしています。AIに関する最新のニュースと研究内容を厳選して紹介する米国版ニュースレター「アルゴリズム(Algorithm)」の執筆も担当。グーグルX(Google X)からスピンアウトしたスタートアップ企業でのアプリケーション・エンジニア、クオーツ(Quartz)での記者/データ・サイエンティストの経験を経て、MITテクノロジーレビューに入社しました。
日本発「世界を変える」35歳未満のイノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

記事一覧を見る
人気の記事ランキング
  1. The problems with Elon Musk’s plan to open source the Twitter algorithm Eマスクがツイッター買収でぶち上げたオープンソース化が危うい理由
  2. Meta has built a massive new language AI—and it’s giving it away for free メタ、「GPT-3並み」の大規模言語モデルを研究者向けに無償提供
  3. How EnChroma’s Glasses Correct Color-Blindness 色覚補正メガネ エンクロマの仕組み
  4. These hackers showed just how easy it is to target critical infrastructure 発電所も使う通信プロトコルのハッキング、わずか2日で攻略
MITテクノロジーレビュー[日本版] Vol.6
MITテクノロジーレビュー[日本版] Vol.6世界を変えるイノベーター50人

mRNAがん治療の事業化を目指す起業家、日本発の量子コンピューター技術を提唱する研究者、グーグルが採用した人工音声を開発した技術者、中国の次世代人工太陽の理論モデルを確立した科学者——。
MITテクノロジーレビューが選んだ、世界のイノベーター35人と日本発のイノベーター15人を一挙紹介。

詳細を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る