オバマも歌う「ばかみたい」、ディープフェイクがますます身近に
知性を宿す機械

Memers are making deepfakes, and things are getting weird オバマも歌う「ばかみたい」、ディープフェイクがますます身近に

日本のビデオゲーム「龍が如く」の中で歌われる「ばかみたい」という曲をネタにしたディープフェイク動画がネット上で大流行している。ディープフェイク作成ツールを誰でも使えるようになったことが主な要因であり、こうしたツールが悪用されることに対する新たな懸念が生じている。 by Karen Hao2020.09.03

グレース・ウィンドハイムは以前からディープフェイクのことを耳にしていたが、どうやって作るのだろうなどとは考えたこともなかった。ディープフェイクを自作する可能性について調べ、それがとても簡単で、しかも完全に無料だと知るきっかけとなったのは、ディープフェイクを使った大人気のインターネット・ミームだ。

ウィンドハイムはディープフェイクの作成過程を1ステップずつ紹介するチュートリアルのユーチューブ動画を1日で制作した。「ディープフェイクを1つ作って、そこに音声を重ねるのは、思っているよりも簡単にできます」。8月4日にアップロードされた動画の中で、彼女はそう話す。このチュートリアルはこれまでに36万回以上視聴されている。

ディープフェイクはますます身近なものとなり、ネット・カルチャーに浸透してきている。ウィンドハイムは、そんな中でディープフェイクをいじって遊ぶオンライン・クリエーターの新たなグループの一員だ。この現象は特に驚くべきものではない。メディアを操作するツールは遊びとパロディを通じて普及の勢いを増すのが常だ。しかし、濫用の可能性についての新たな懸念も生じている。

 

ディープフェイクはすでに、本人の同意を得ずに女性の顔をポルノビデオに合成する嫌がらせ行為に使われている。学者たちは選挙戦がかき乱されるのを恐れている。ミーム用に作成されるディープフェイクは今のところまだ明らかに偽物と分かるため比較的害は少ないが、それも長くは続かないかもしれない。

「エンターテインメントやミームを目的にディープフェイクを使うことは、加害目的で使うことと紙一重の違いしかありません」とウィンドハイムは言う。「このチュートリアルで、私は特定のディープフェイクの作り方を紹介しています。しかし、恐ろしいのは、このスクリプトが、どういったタイプのものであれ、お望みのディープフェイクを作るのに使えるところです」。

「ばかみたい」

大学を卒業したばかりのウィンドハイムは、サンフランシスコのスタートアップ企業であるカプウィング(Kapwing)でコンテンツ・クリエーターとして働いている。ミーム・メーカーとして事業を立ち上げたカプウィングは、ブラウザベースの動画編集ソフトウェア・ツール一式を無料提供している。ウィンドハイムは仕事の一環としてユーチューブ・チャンネルを運営し、自社製品の性能をアピールするコンテンツ・マーケティング動画を制作している。

8月の初め、ウィンドハイムはグーグル・トレンドで、検索回数が突出して多い検索ワードに出くわした。上位5つの検索クエリのうち3つが、「ばかみたい(Baka Mitai ) ディープフェイク ミーム」に関するものだった。「特定のクエリがあんなに頻出するのは、ほとんど見たことがありません」とウィンドハイムは言う。

このミームの元ネタとなっているのは、日本のビデオゲーム「龍が如く」の中で歌われる「ばかみたい」(英訳:I’ve Been a Fool)という曲を、口パクで熱唱するユーチューブ動画だ。さまざまなインターネットユーザーがこの動画を使って他愛もないディープフェイクを作り、バラク・オバマからサノスまで、実にさまざまな人物がこの曲を歌う動画が生み出されていた。とても人気があるミームにもかかわらず、実際の作り方についてはあまり紹介されていないことにウィンドハイムは気が付き、そこにチャンスを見出した。

 

「ばかみたい」ミームを作るのに使われていたアルゴリズムは、世界最大級の人工知能(AI)研究カンファレンス「NeurIPS(Neural Information Processing Systems、神経情報処理システム)」で2019年に発表された、ある研究論文に由来するものだ。より複雑な他のディープフェイク用アルゴリズムとは違い、このアルゴリズムでは人物の顔を写した動画なら何でも使うことができ、ほんの数行のコードを書くだけで、別の誰かの顔写真をアニメーションのように動かせる。

このアルゴリズムはオープンソース化されており、ウィンドハイムはユーチューブのチュートリアル動画の中でそれを見つけて、グーグル・コラボのノートブックに移植した。グーグル・コラボは、クラウド上でコードを走らせるための無料サービスだ。大学時代に時々受講していたコーディングの授業で身に着けたスキルを使いながら何度か試行錯誤を繰り返すと、ディープフェイク動画を出力するスクリプトが出来上がった。ウィンドハイムは次に、カプウィングのツールを使って曲をビデオと同期させ、「ばかみたい」ミームの新バージョンを生み出した。

ウィンドハイムがチュートリアルをカプウィングのユーチューブ・チャンネルに投稿して以来、他の大勢のユーチューバーたちも同じコピー&ペーストのアルゴリズムを使ったチュートリアル動画を制作している。ウィンドハイムの動画との違いは、その多くが視聴者に対してあらゆる種類のディプフェイク・ミームの作り方を教えていることだ。スマホでディープフェイクを作成する方法を教えるものまである。

ディープフェイクを使ったミームは今や、ツイッターやインスタグラム、ティックトック(TikTok)などのソーシャルメディアで大人気だ。特にティックトックでの人気は高い。ティックトックのショートビデオはキャッチーな曲に合わせて軽快に踊るという内容が多いため、ディープフェイクと組み合わせることで特に人を惹きつける効果を生み出しやすい。ティックトックでは、ハッシュタグ「#deepfake」がすでに1億2000万回以上の閲覧回数を記録している。

@lemonjezusi did one with @afiqhakim this time hope y’all enjoy! ##deepfake ##pokimane ##xqc ##drdisrespect ##tsmmyth ##greekgodx ##tyler1 ##sodapoppin ##ludwig ##tfue

♬ All TikTok Mashup (JVKE – Upside Down) – imjakelawson

@helltaker03##huronarolera ##bellapoarch ##аниме ##anime ##аниметоп ##rek ##top ##tik_tok ##tiktok ##длявас ##fyp ##рекомендации ##рек ##топ ##р_е_к_о_м_и_н_д_а_ц_и_и

♬ оригинальный звук – helltaker03

このアルゴリズムを使った動画では人物の顔に一目瞭然の違和感があり、加工されたものだということは簡単に分かる。それもディープフェイクのユーモアの一部なのだ。こういった不完全さや、ミームのシュールな味わいが、現実との混同を防いでくれるだろう。少なくとも今のところ、より超リアルなディープフェイクの作成は技術的にずっと難しいうえ、必要な演算コストも比べ物にならない。

だが、現在の速さで技術が進歩していけば、手軽に作成できて、しかも現実と見分けがつかないほどリアルなディープフェイクもすぐに登場しそうだ。ウィーチャット(WeChat)を所有する中国テック企業大手のテンセントをはじめとするいくつかの企業が、この最先端技術の商用利用を推進するためにより多くのリソースを投入する意向を公にしている。

ディープフェイクが本質的に悪い技術であるというわけではない。アーティストや教育者をはじめとする人々はすでに、創造的表現に役立つ新しく強力なツールとしてこのテクノロジーを利用している。たとえば今年2月には、タイム(Time)誌がディープフェイクを使い、マーティン・ルーサー・キング・ジュニアの「私には夢がある」の演説を実質現実(VR)上で再現した。いずれは、何が適切な使用で何が害をもたらしうるか、規制者側が定義しなければならないだろう。

今のところ、ウィンドハイムはその判断を自分自身で下している。チュートリアル動画を投稿する前にディープフェイクの影響力について調べ、同僚たちと話し合った。「私たちは、デマを広めるために自社製品が使われるのを望んでいません」とウィンドハイムは言う。「ですから、自分たちが良識を失っていないかどうか確認しておきたかったのです」。

話し合いの結果、ウィンドハイムたちはいくつかの基本原則を定め、チュートリアルでは特定のミームの作成方法だけを扱うこと、そして、その文脈から外れたディープフェイクの作り方は決して取り上げないことを決めた。 エンターテインメントとミーム・カルチャーの範囲内に収まる限りは「安全地帯の中です」とウィンドハイムは言う。