コンピューティング

Mobile Phone Data Reveals Literacy Rates in Developing Countries 携帯電話の使用履歴で
所有者の読み書き能力を判別

機械学習アルゴリズムによって、ある個人が読み書きできるかを携帯電話の使用履歴から判別できるようになった。 by Emerging Technology from the arXiv2016.07.14

今世紀の国連の発展目標のひとつは、2030年までに極度の貧困を撲滅することだ。貧困には多くの要因があり、生半可な仕事では済まない。しかし、もっとも明らかな貧困の要因は、読み書きができない人が世界中に7億5000万人おり、その3分の2が女性であることだ。

ヒト、モノ、カネをどこに割り当てるかがわかれば、解決に尽力できる団体はいくつもある。したがって、識字率が低い地域を特定するのが最初の一歩になる。

世帯調査を実施すれば状況を把握できる。しかし調査には時間も費用もかかるため、定期的には繰り返せない。しかもたいていの場合、発展途上国のデータは効果的に使うには社会の変化が早すぎて役に立たない。したがって、識字率を地域別に把握する迅速で安上がりな方法が求められている。

13日、ノルウェーのフォーネブ地域にあるテレノール・グループ研究所のパル・サンドシー研究員は、携帯電話の通話履歴から識字率を判定する方法を開発したと発表した。

サンドシー研究員の手法は、純粋な計算処理だ。まず、アジアのある発展途上国在住の7万6000人の携帯電話ユーザーを対象に、標準的な世帯調査の専門調査会社が、携帯電話の持ち主が自分の電話番号を読めるか調べた。

次にサンドシー研究員は、ある人が自分の電話番号を読めたか読めなかったかのデータと、携帯電話会社の通信・通話記録に紐付けた。通話やメールの回数、通話時間、通話時間の購入記録、最寄りの基地局の位置データなどと、読む能力を結びつけたのだ。

データを分析することで、サンドシー研究員は各ユーザーが通話やメールをしたときの位置、メールの受信数、時間帯などを割り出せた。さらに通話相手や頻度などを割り出し、ユーザー同士の社会的な繋がりをデータ化したのだ。

最後にサンドシー研究員は、入手した75%のデータを使って、統計と機械学習テクノロジーを駆使して文盲のユーザーに共通するパターンを見つけ出し、残りの25%を使って、このパターンが文盲の人や文盲率が高い地域を特定するのに使えるのかどうかを確かめた。

結果は興味深い。サンドシー研究員は、機械学習アルゴリズムは文盲率を予測できる複数の要因を発見した、という。一番関係があるのが、ユーザーが一日の多くの時間を過ごす場所だ。

「このモデルはスラム地域など、経済発展度が低い地域の高い文盲率を捉えた、という仮説が成り立ちます」

もうひとつの文盲の予測指標は、メールの受信数と、受信数と送信数との差である。文盲とわかっている相手にメールは送信しないから、文盲の人は字が読める人よりメールの受信数が少なめになる。さらに、字が読めなければ書けないから、メールの送信数も少なめになる。

SNSも、有効な指標といえる。「文盲の人のコミュニケーションは、少人数に限られる傾向があります」というサンドシー研究員の分析は、経済的余裕は社会的繋がりの多様性に比例すると指摘した他の調査とも一致する。

したがって、機械学習アルゴリズムは高い精度で文盲の人を見つけ出せる、とサンドシー研究員はいう。「各モバイルユーザーの経済的、社会的、また移動状況をデータから導きだすことで、70%の精度で個人の文盲度を予測できます」というサンドシー研究員は、この手法で識字率が低い地域を特定できる、と述べた。

識字率が低い地域で活動したい援助団体には便利なやり方だ。ただし、この手法が他のデータと組み合わせても、あるいは調査対象とは異なる地域でも同じように予測できる証拠は求められるだろう。もし他の場合でも通用するなら、生活を向上させる可能性は非常に大きい。低い識字率は貧困の悪循環をもたらす。生活に必要なレベルで字が読めなければ仕事の応募用紙に記入できず、薬のラベルも読めず、小切手も切れず、口座残高も確認できない。不利な状況にあれば、無職のまま、健康状態が悪く、社会福祉や慈善に依存しやすい。自身の子どもが読み書きを学ぶ手助けもできない。

この悪循環に終止符を打つのが、重要な目標だ。

サンドシー研究員の論文は、携帯電話履歴を統計調査に利用する、大きなトレンドの一部だ。たとえばアフリカ西海岸のコートジボワールの資産分布をマッピングした統計学者は、この手法は国勢調査を置き換えるかもしれない、という。

携帯電話データによる調査の精度がわかれば、統計学者の重要なツールになる。また、ある地域の社会経済状態をリアルタイムに描ければ、問題発生時に、必要な援助を必要な地域にもたらせるはずだ。強力なツールになる。

関連ページ

人気の記事ランキング
  1. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
  2. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
  3. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
  4. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
  5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持
この記事をシェアしてください!
この記事が気に入ったら
いいね!しよう
エマージングテクノロジー フロム アーカイブ [Emerging Technology from the arXiv]米国版 寄稿者
Emerging Technology from the arXivは、最新の研究成果とPhysics arXivプリプリントサーバーに掲載されるテクノロジーを取り上げるコーネル大学図書館のサービスです。Physics arXiv Blogの一部として提供されています。メールアドレス:KentuckyFC@arxivblog.com RSSフィード:Physics arXiv Blog RSS Feed
コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

0 コメント
    「ビッグデータ」の記事
    人気の記事ランキング
    1. Wikileaks E-Mails Are an Election Influence to Really Worry About クリントン不支持の世論形成は、ロシアによる選挙干渉
    2. Neural Network Learns to Identify Criminals by Their Faces ニューラル・ネットワーク、「犯罪者顔」で犯罪者を判定
    3. Can social media control public opinion? ソーシャルメディアで世論は操作できるか?
    4. Machines Can Now Recognize Something After Seeing It Once グーグル・ディープマインド、大量データ不要の深層学習システムを開発
    5. How the Bot-y Politic Influenced This Election 大統領選ツイートは約20%がボット、約75%はトランプ支持