フェイスブック、インスタのハッシュタグで画像認識を訓練
インスタグラムのユーザーは、ハッシュタグを使って何十億枚もの画像を分類してきた。実はこれらのユーザーたちは意図せず、フェイスブックのコンピューター・ビジョン・アルゴリズムを訓練するのに打ってつけのラベルを作成してきたのだ。
フェイスブックは、画像に含まれる物体の認識能力を向上させるために、公開されているインスタグラムのアカウントから引き出した35億枚の写真と1万7000のハッシュタグで構成する訓練用のデータセットを作成した。5月2日に開催した開発者向け年次カンファレンス「F8」のステージ上で発表した。フェイスブックは、作成したデータセットのサブセットを訓練に使うことで、85.4%の写真に正確なラベルを付けられたという。過去最高水準の結果だ。
だが、フェイスブックが無料で得た労働力には欠点がある。#photooftheday(今日のベストショット)や、「Throwback Thursday(木曜に投稿する昔の写真)」の略である#tbtのようなハッシュタグは、画像に含まれるものを表現していない。そのため、アルゴリズムを混乱させる可能性があるのだ。
より精度の高い画像認識は、関連性のより高いコンテンツの表示から、サイトから不適切な投稿をなくすことまで、さまざまな役に立つ。マーク・ザッカーバーグCEO(最高経営責任者)はすでに、ユーザーのデータの扱い方について釈明しなければならない羽目に陥っている。自分の休暇の写真がアルゴリズム改良に使われていることを知って、不愉快な思いをする人も当然出てくるだろう。
オープンAIが「年齢予測」導入、子ども保護の責任誰が負う?
MITの学生は「世界を変える10大技術」から何を学んでいるか?
eムック 『2026年に注目「気候テック企業」10社』特集号
期待外れのCRISPR治療、包括的承認で普及目指す新興企業
書評:サム・アルトマンはいかにして「AI帝国」を築いたか