全世界のWebから知識を構築、グーグル超え目指すAI企業
スタンフォード大学のスタートアップ企業であるディフボットは、何十億ものWebページに対して画像認識と自然言語処理を適用して、巨大なナレッジグラフを構築している。尋ねられた質問のすべてに対し、事実に基づく受け答えができる人工知能(AI)を構築するのが目標だ。 by Will Douglas Heaven2020.09.11
非営利の研究機関であるオープンAI(OpenAI)がこの7月に発表した最新の言語モデル「GPT-3」は、まるで人間が書いたかのような文章を大量に生み出す能力で人々を魅了した。人々は、GPT-3がどのようにコードを自動的に補完したり、スプレッドシートの空欄を埋めたりできるのかを披露し始めた。
その一例として、ツイッターの社員のポール・カットセンが、ツイートしたのが、GPT-3が勝手に列を埋めていく「スプレッドシートのすべてを支配する関数」だ。この関数は、ミシガン州の人口は1030万人、アラスカは1906年に州になった、などといった米国の州についてのデータを引っ張ってくる。
ただし、GPT-3は、ちょっとした嘘つきでもある。ミシガン州の人口が1030万人になったことはないし、アラスカが州になったのは1959年だ。
GPT-3のような言語モデルは模倣に長けているが、実際の話の内容のほとんどはわけのわからないものだ。「言語モデルは、ユニコーンのような架空の物語を生成するのは得意ですね」。スタンフォード大学のスタートアップ企業であるディフボット(Diffbot)の最高経営責任者(CEO)のマイク・タンはこう話す。「しかし、事実であることを訓練されてはいません」。
AIに信頼性を求めるのなら、このことは問題となる。そこでディフボットは、他の言語モデルとは異なるアプローチを採用した。それは、世界中のWebページを読み込み、可能な限り多くの事実を抽出する人工知能(AI)を構築するというものだ。
ディフボットのシステムはGPT-3と同様に、オンラインにある膨大な量の人間が書いたテキストを吸い上げて学習する。ただし、それらのデータを言語モデルの学習に使うのではなく、読み取ったものを主語、動詞、目的語の3つの部分から成る一連の疑似事実(ファクトイド)に変換する。
たとえば、私の略歴であれば、ディフボットはウィル・ダグラス・ヘブンがジャーナリストであること、ウィル・ダグラス・ヘブンがMITテクノロジーレビューで働いていること、MITテクノロジーレビューはメディア企業であることなどを学習する。これらの疑似事実は、何十億もの他の疑似事実と結びつき、無秩序に広がり互いに結び付いたネットワークを形成する。これは「ナレッジグラフ」として知られている。
ナレッジグラフ自体は新しいものではない。何十年も前から存在しており、初期のAI研究の基本的な概念だった。しかし、概して手作業で実施されてきたナレッジグラフの構築と保守は大変であり、「Webの父」であるティム・バーナーズ=リーが「セマンティックWeb」と呼ぶものはなかなか実現できなかった。ボットが航空券を予約したり、買い物をしたり、検索エンジンより賢い回答を提供したりできるように、人間だけでなく機械のための情報も、セ …
- 人気の記事ランキング
-
- A tiny new open-source AI model performs as well as powerful big ones 720億パラメーターでも「GPT-4o超え」、Ai2のオープンモデル
- The coolest thing about smart glasses is not the AR. It’s the AI. ようやく物になったスマートグラス、真価はARではなくAIにある
- Geoffrey Hinton, AI pioneer and figurehead of doomerism, wins Nobel Prize in Physics ジェフリー・ヒントン、 ノーベル物理学賞を受賞
- Why OpenAI’s new model is such a big deal GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由