コンピューティング

The Growing Problem of Bots That Fight Online Wikipediaで繰り広げられる
ボット同士の壮絶な編集合戦

Web上で活動するボットの実態はあまり解明されていなかったが、研究により、ボット同士で何年にもわたる「論争」が続いていたことがわかった。 by Emerging Technology from the arXiv2016.09.21

ソフトウェアエージェント(ボット)はWebでは珍しくない。ボットはWebページのデータを収集し、Wikipediaで荒らされた編集内容を修正し、スパムを生成し、人間の真似さえしている。

ボットの影響も増大中だ。Webページ訪問数の49%、広告クリック数の50%以上が、ボットだとする見解もある。ボットの数は指数関数的に増えており、影響はさらに拡大している。

オックスフォード大学(イギリス)のターハ・ヤッセリ研究員らのチームは「いまや、意思決定や選択肢の提示、選択、サービスなどが、正確で、有効で、うまく働くボットに依存しており、その数はどんどん増えています。ですが、私たちは、デジタルな「しもべ」の活動実態や進化について、ほんのわずかしか知らないのです」という。

この着眼点から、興味深い疑問がわいてくる。ボット同士はどう連携しているのだろうか。ボット間の共同作業は、人間同士の連携とどう違うのだろうか。

20日、研究チームは、Wikipedia上のボットの連携を調査し、この疑問に光をあてた。その結果明らかになったのは、サイバー空間で、物事はうまくいっていない、ということだ。

「私たちは発見しました。百科事典を支えるWikipediaのボットは、お互いに編集内容を取り消しており、不毛な『編集合戦』が何年間も続くことがあるのです」

Wikipediaは、手間のかかる継続的作業(異なる言語間のリンク作成、スペルチェック、荒らし行為による編集の取り消しなど)を処理するために、長年に渡ってボットを使ってきた。2014年には、Wikipedia全言語版の編集のうち、約15%がボットだった。

ボットを実行するにはWikipediaの承認が必要であり、Wikipediaが定めたボットの運用方針に従わなければならない。つまり、理論上は、Wikipediaのボットの世界は、幸せでうまくいくはずなのだ。しかし、実際は、違った状況になっている。

研究チームは、特に、ボット同士が互いの編集に不同意かどうかに着目する。Wikipediaでは「取り消し」(ある記事を変更前の状態に戻すこと)を評価することが不同意の指標になる。

評価対象の10年間で、人間は他人の編集内容を、一人当たり平均約3回取り消した。一方ボットは、ずっと積極的に取り消す。研究チームによれば「同じ10年間で、英語版のWikipediaのボットは、他のボットによる編集内容を、平均105回も取り消していました」という。

異なる言語のWikipediaでは、顕著な違いがある。たとえばWikipediaドイツ語版で働くボットは、平均24回取り消していたが、ポルトガル語版では、ボット同士で約185回も取り消していた。

ボットと人間では、取り消しのタイミングもだいぶ異なる。人間の取り消しは、多くの場合、編集後2分以内か、24時間後、でなければ1年後だ。この間隔は、明らかに、人間のライフスタイルが持つリズムと関係している。

ロボットは当然、人間のリズムとは関係なく動作している。むしろ、ボットに特有の平均反応時間は1カ月だ。研究チームは「この違いは、第1に、ボットは計画的に記事を巡回していること、第2に、ボットは、編集頻度を制限されていることが原因と思われます」としている。

計画的で動作が制限されているにもかかわらず、ボット同士の大規模な論争が発生したり、まさに人間並みの、予測できない、非効率的な行動をとったりするのはなぜだろうか。

研究チームの考えでは、その答えはこうだ。「コミュニティをボトムアップ方式で運営すると、意見の不一致が起きやすいのです。記事を編集する人間は、ボトムアップ方式で、個別にボットを作り、動作させています。組織的に、他のボット所有者とは調整していません」

実際、編集合戦の多くは、異なる言語版のWikipediaページをつないで、リンクを作成・変更することに特化したボット同士で起こっている。原因は、ボットを管理している人間が、それぞれ異なる言語を使っていて、お互いに連携しにくいからかもしれない。 「連携不足は、異なる言語間で、命名規則や慣習が少し違っていることに起因するのかもしれません」と、研究チームはいう。

この研究が興味深いのは、比較的シンプルなボットが、複雑な関係性をどのように生み出し、意図しない結果を生じさせるかを示していることだ。Wikipediaは、理性的な形でロボットの使用をしっかりと規制する、制限付きのコミュニティだ。そうなると、制限がもっと緩い場合に事態はどうなっているのか気がかりになってくる。

この状況は、他の分野(たとえばツイッターのようなソーシャルメディア)では異なるだろう。ある研究グループは、2009年の全ツイートのうち、4分の1がボットだったと見積もっている。この値は、当時に比べて大きく変化しているだろう。すっかり人間と見分けがつかない、最新のボットの事例も数多い。

ボットが、規制が比較的弱い環境下で作り出す関係性は、推測の域を出ない。だが、それはすなわち、今後の興味深い課題として、ボット間の相互作用の姿を理解し、ボットが生み出す複雑な関係性を描き出す研究が待たれている、ということだ。

参照:arxiv.org/abs/1609.04285 : 善良なボットも論争を起こす

人気の記事ランキング
  1. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
  2. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
  3. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
  4. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
  5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持
この記事をシェアしてください!
この記事が気に入ったら
いいね!しよう
エマージングテクノロジー フロム アーカイブ [Emerging Technology from the arXiv]米国版 寄稿者
Emerging Technology from the arXivは、最新の研究成果とPhysics arXivプリプリントサーバーに掲載されるテクノロジーを取り上げるコーネル大学図書館のサービスです。Physics arXiv Blogの一部として提供されています。メールアドレス:KentuckyFC@arxivblog.com RSSフィード:Physics arXiv Blog RSS Feed
「インターネットアクセス」の記事
人気の記事ランキング
  1. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
  2. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
  3. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
  4. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
  5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持