KADOKAWA Technology Review
×
ロシアW杯の優勝国を機械学習で予測、結果は惨敗
Matthias Hangst | Getty
ニュース Insider Online限定
Machine learning predicts World Cup winner

ロシアW杯の優勝国を機械学習で予測、結果は惨敗

7月15日に閉幕したサッカーのワールドカップ・ロシア大会では、フランスが20年ぶりに優勝した。W杯でどこが優勝するのかは、毎回、大きな話題になる。開幕前に機械学習を使って研究者が予測していた見立ては、残念ながら大きく外れる結果となった。 by Emerging Technology from the arXiv2018.07.18

ロシアで開催された2018年サッカー・ワールド・カップは、オリンピックをもしのぐほどの人気だ。歴史上もっとも広く見られたスポーツ・イベントの1つかもしれない。そのため、毎回、どのチームが優勝するかについて、大きな関心が寄せられる。

結果を判断する方法の1つは、スポーツ賭博の賭け屋(ブックメーカー)のオッズを見ることだ。賭け屋は、プロの統計家に結果に関する広範なデータベースを分析させ、可能性のある試合の組み合わせに関して異なる結果の確率を定量化する。こうしておけば、数週間にわたるすべての試合とその試合の勝者に関するオッズを、賭け屋は提供できる。

さらに確率の高い推定をしたいならば、多くの異なる賭け屋のオッズを徹底的に調べればいい。この方法によると、2018年のワールド・カップでブラジルが優勝する確率は16.6%で他を寄せ付けず、次にドイツ(12.8%)、スペイン(12.5%)の順となった。

しかし近年、従来の統計的アプローチを上回る可能性を持つ機械学習の手法を、研究者は開発してきた。この新しい手法は、2018年ワールド・カップの結果をどう予測したのだろうか。

その答えを出したのは、ドイツ・ドルトムント工科大学のアンドレアス・グロール准教授のチームによる研究である。研究チームは、機械学習と従来の統計の組み合わせた「ランダム・フォレスト」と呼ばれる手法を使って、統計的アプローチとは異なる国のチームが優勝する確率が高いと特定した。

最初に、研究の背景を述べておこう。ランダム・フォレスト技法は、他のデータ・マイニング手法の落とし穴を一部回避しながら、大規模なデータ・セットを分析する強力な方法として近年登場した。一連の訓練データを参照して各ブランチ(枝)の結果を計算する決定木によって、将来の事象は決定されるとの考えに基づくものだ。

しかし、決定木にはよく知られている問題がある。分岐工程の後半で、決定木はわずかなデータで訓練するためひどくゆがみ、回答が大きく変化しがちだ。この問題は過剰適合(Overfitting)と呼ばれている。

ランダム・フォレストの手法は違 …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
【春割】実施中! ひと月あたり1,000円で読み放題
10 Breakthrough Technologies 2024

MITテクノロジーレビューは毎年、世界に真のインパクトを与える有望なテクノロジーを探している。本誌がいま最も重要だと考える進歩を紹介しよう。

記事一覧を見る
気候テック企業15 2023

MITテクノロジーレビューの「気候テック企業15」は、温室効果ガスの排出量を大幅に削減する、あるいは地球温暖化の脅威に対処できる可能性が高い有望な「気候テック企業」の年次リストである。

記事一覧を見る
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る