Junk websites filled with AI-generated text are pulling in money from programmatic ads

生成AIで広告収入目的のゴミサイトが急増、1日1200本更新も

広告収入目的の「MFA」と呼ばれる低品質なWebサイトで、生成AIの導入が進んでいることが分かった。中には1日1200本以上の記事を生成しているサイトもあり、自動化が急速に進んでいる様子が伺える。 by Tate Ryan-Mosley2023.06.28

542
9

AIチャットボットを活用して生成された文章によって構成されたWebサイトが、グーグルなどを経由して広告収入を得ている。メディア研究機関のニュースガード（NewsGuard）が作成し、MITテクノロジーレビューに独占的に提供された新たな報告書によって、こうした実態が明らかになった。

140社を超える大手ブランドが、おそらく知らず知らずのうちに、AIで作成された信頼性の低いサイトの広告費用を支払っているとみられる。こうしたAI生成ニュースサイトで見つかった大手ブランドの広告の90％はグーグルが配信したもので、グーグル自身のポリシーに違反している。こうした行為によって多額の広告費が無駄になるだけでなく、AI生成コンテンツで溢れかえり、不具合とスパムにまみれたインターネットの到来が早まってしまう可能性がある。

大部分の企業はオンライン広告を出す際、「プログラマティック広告」と呼ばれる仕組みを使い、広告枠の入札を自動化している。ターゲット・オーディエンスの目に留まるように実行された複雑な計算に従って、アルゴリズムがさまざまなWebサイトに広告を配置する。その結果、大手ブランドは、人間のチェックをほとんどあるいはまったく受けないまま、聞いたこともないようなWebサイトに広告料を支払うことになってしまう。

この仕組みに乗じ、広告収入を得ることを目的として、低賃金の人間に低品質のコンテンツを量産させる、いわゆる「コンテンツ・ファーム」が登場した。この手のWebサイトは「MFA（Made For Advertising）」と呼ばれ、クリックベイト、自動再生動画、ポップアップ広告などの手法を駆使し、広告主からできるだけ多くの広告費を引き出そうとする。最近の調査で、米国広告主協会は、調査サンプル内の広告インプレッションのうち21％がMFAサイトに流れていることを明らかにした。米国広告主協会の推定では、MFAによって無駄になる資金の総額は全世界で年間約130億ドルに上るという。

今では生成AI（ジェネレーティブAI）の登場で、コンテンツファームのプロセスを自動化し、手間を減らしてこれまでより多くのジャンクサイトを運営する新たな手法が生まれた。ニュースガードはこれを「信頼性の低いAI生成ニュースWebサイト」と呼んでいる。ニュースガードが報告したサイトの中には、1日に1200本以上の記事を生成していたものもあった。

このような新手のサイトには、架空の執筆者の写真やプロフィールをAIで生成するなど、手の込んだ作りで説得力を持たせたものも存在する。そして問題は急速に深刻化している。インターネット全体のWebサイトの品質を評価しているニュースガードによれば、新たなAI生成サイトは毎週およそ25件見つかっているという。ニュースガードは今年4月からAI生成サイトの追跡を開始しており、これまでに13言語で217サイトを発見してきた。

ニュースガードは、AIが作成したジャンクサイトを識別するにあたって、特徴的な手法を使っている。こうしたサイトは多くが人間のチェックを経ずに作られているため、生成AIシステム特有のエラーメッセージがあちこちに紛れ込んでいるのだ。たとえば「カントリーローカルニュース（CountyLocalNews.com）」というサイトには、「申し訳ありません。倫理および道徳の原則に反するため、プロンプトの指示を実行できません。 AI言語モデルとしての私の責任は、事実に基づく信頼性のある情報を提供することです」とのメッセージがあった。

ニュースガードのAIはWebサイトからこのようなテキストの断片を探し出し、人間のアナリストがそれをレビューする。

グーグルは「AI生成はポリシー違反ではない」

「この手のAI生成サイトの主な収入源はプログラマティック広告だと考えられます」と語るのは、ニュースガードのアナリストで、AI生成コンテンツを追跡するロレンゾ・アルバニティスだ。「こうしたサイトに広告を出し、知らず知らずのうちに支えている企業にはフォーチュン500企業が多数存在するほか、著名なブランドも含まれていることがこれまでに分かっています」。

ニュースガードがMIT テクノロジーレビューに提供したリストには、プログラマティック広告を配信するAI生成サイト上でニュースガードが特定した400近い広告が記載されていた。広告は140を超える大手ブランドから提供されており、金融、小売、自動車、ヘルスケア、電子商取引など、多種多様な業界の企業が含まれている。プログラマティック広告の平均コストは2023年1月時点で1000インプレッションあたり1.21ドルであり、広告掲載には費用がかかるにもかかわらず、ブランド各社が広告の自動配置をすべてレビューすることは少ない。

グーグルのプログラマティック広告製品であるグーグル広告は最大の取引所であり、昨年の広告売上高は1680億ドルに達した。グーグルはこれまでもコンテンツファームへ広告を配信しているとして批判を受けてきた。「スパムに類する自動生成コンテンツ」のあるページにグーグルが配信する広告の配置を自社ポリシーで禁止しているにもかかわらずだ。ニュースガードが報告したサイトの約4分の1が、大手ブランドからのプログラマティック広告を掲載している。AI生成サイト上で見つかった大手ブランドの広告393件のうち、356件はグーグルから配信されていた。

「グーグルのプラットフォームで収益化できるコンテンツの種類を管理するにあたっては、厳格なポリシーが定められています」。グーグルのポリシー関連広報部長のマイケル・アシマンはMITテクノロジーレビューの取材にメールで回答した。「たとえば有害なコンテンツ、スパムに類するコンテンツ、価値の低いコンテンツ、あるいは他のサイトのものを完全にコピーしたコンテンツと一緒に広告を表示することをグーグルは許可していません。こうしたポリシーを執行するにあたって、グーグルはコンテンツの作成方法よりも品質に焦点を当て、違反が検出された場合は広告の配信をブロックするか広告を削除します」。

大部分の広告取引所とプラットフォームはすでに、コンテンツファームへの広告配信を禁止するポリシーを定めている。だが、デジタルフォレンジックおよび広告検証サービスを提供するアダリティクス（Adalytics）のクシシュトフ・フラナシェク創業者は、「ポリシー執行の度合いはまちまち」の状況であり、「品質ポリシー違反が疑われる（MFA）サイト上に広告を配信し続けている取引所やプラットフォームは多数存在します」と指摘する。

グーグルによれば、Webページ上にAI生成コンテンツがあったとしても、本質的なポリシー違反にはならないという。「また、悪意ある人たちは常にアプローチを変え、たとえば生成AIのようなテクノロジーを活用し、グーグルのポリシーとその執行システムを回避するかもしれないことを私たちは認識しています」とアシマン部長は述べた。

「がんを防ぐ」有害な健康情報も

ニュースガードによれば、AI生成サイトの大部分は「低品質」ではあっても「誤情報を広めることはない」という。しかしコンテンツファームを取り巻く経済的ダイナミクスの中では、ジャンク情報や誤情報で満ちたクリックベイト同然のWebサイトを作れば利益が生まれる。今やAIを使ってそれを大規模に実行できるため、誤情報の問題が深刻化するおそれがある。

たとえば、AI生成記事を載せた「メディカルアウトライン（MedicalOutline.com）」というサイトでは、「レモンで皮膚アレルギーは治るか？」「ADHDに有効な5つの自然療法とは？」、そして「がんを自然に防ぐ方法とは？」などの見出しで、健康に関する有害な誤情報を広める記事が掲載されていた。ニュースガードによれば、サイトには銀行業のシティグループ、自動車メーカーのスバル、ウェルネス会社のGNCを含む9つの大手ブランドの広告が掲載されていたという。広告はグーグルを通じて配信されていた。

MITテクノロジーレビューがアダリティクスに確認したところでは、6月24日時点でメディカルアウトラインの広告はグーグルを通じて掲載されたとみられる。MITテクノロジーレビューはメディカルアウトライン、シティグループ、スバル、GNCに対してコメントを求めたが、現時点で回答は得られていない。

MITテクノロジーレビューがメディカルアウトラインやその他のサイトの広告をグーグルに報告した後、同社のアシマン部長は、グーグルが「ポリシー違反が蔓延している」ことを理由に多くのサイトでの広告配信を停止したと述べた。ただし6月25日時点で、メディカルアウトライン上にはまだ広告が表示されていた。

「ニュースガードの調査結果によって、グーグル、広告テック企業、そしてニュースサイトやコンテンツファームを装ったAIベースの次世代誤情報サイトの出現との間に存在する憂慮すべき関係性に光が当たりました」と、ニュースガードのジャック・ブリュースター編集者は言う。「プログラマティック広告の不透明性によって信頼できないサイトへと広告費が流れ込み、大手ブランドは意図せず、気がつかないうちに、このようなAI生成サイトへ間接的に資金を提供する支援者になってしまっているのです」。

プログラマティック広告を取り巻く状況にAI生成コンテンツがどんな影響を及ぼすか、それを判断するには時期尚早だとフラナシェク創業者は言う。結局のところ、そのようなサイトが収益を得るためには人間をコンテンツに引き付ける必要があり、生成AIによってそれが容易になるかどうかは現時点で明らかではないのだ。毎月のページビューが数千で、収益は数ドルだけというサイトも中にはあるだろう。

「コンテンツ生成にかかるコストはおそらく、（MFA）サイト運営にかかる総コストの5％以下です。国外の低コスト労働者をAIに置き換えたところで、状況が大幅に変わる可能性は低いでしょう」（フラナシェク創業者）。

インターネットの経済モデル全体が広告によって支えられていることを踏まえると、問題を容易に解決できる方法は存在しない。「プログラマティック広告、そしてさらに広く言えばターゲティング広告こそが、インターネット経済の根本的な推進力であることを覚えておくことが重要です」。ワシントンD.C.のシンクタンク、情報技術イノベーション財団（ITIF）の上級AI政策顧問のホーダン・オマールはこう指摘する。

「もし政策立案者がこの種の広告サービス利用を禁止すれば、消費者にとってのインターネットは根本から様変わりすることでしょう。関連性の低い広告が増え、オンラインコンテンツやサービスの品質が低下し、無料では利用できないものも増えていきます」。

オマール顧問は、「プログラマティック広告を完全に排除することに主眼を置くよりも、直接的あるいは間接的な誤情報拡散を補足するメカニズムの堅牢性をどう高めていくかにフォーカスした政策が望ましいです」と話している。

542
9

人気の記事ランキング

テイト・ライアン・モズリー [Tate Ryan-Mosley]米国版テック政策担当上級記者: 新しいテクノロジーが政治機構、人権、世界の民主主義国家の健全性に与える影響について取材するほか、ポッドキャストやデータ・ジャーナリズムのプロジェクトにも多く参加している。記者になる以前は、MITテクノロジーレビューの研究員としてニュース・ルームで特別調査プロジェクトを担当した。前職は大企業の新興技術戦略に関するコンサルタント。2012年には、ケロッグ国際問題研究所のフェローとして、紛争と戦後復興を専門に研究していた。

生成AIで広告収入目的のゴミサイトが急増、1日1200本更新も

グーグルは「AI生成はポリシー違反ではない」

「がんを防ぐ」 有害な健康情報も

「がんを防ぐ」有害な健康情報も