5 月16日、Googleはここしばらくの間でもっとも野心的かつ興味深い検索エンジンのアップデートをリリースする。一般公開は数日後になる予定だが、検索キーワードに関連ある重要な事実が検索ページの右側の大きなパネルの中に表示されるようになる。このパネルはGoogleが知識グラフ(Knowledge Graph)と呼ぶ新しいテクノロジーによって提供される。

その役割は大きくわけて2つある。1つは、検索キーワードに関連する主要な事実を表示することだ。著名人の場合なら生年月日その他経歴データ、ミュージシャンならコンサート情報、書籍、建築物、動物等々についてもそれぞれに適切な情報が表示される。2つ目の役割は、ユーザーが検索キーワードで何を意味しているのか明確化するのを助けることだ(Wikipediaの「曖昧さ回避」のページの役割)。ユーザーはこの機能を使って、たとえばkingsを検索した場合、アイスホッケーのL.A.Kingsを検索したいのか、あるいはバスケットのSacramento Kingsを検索したいのかGoogleに知らせることができる。

Googleはこの知識グラフを可能にするセマンティック〔意味論的〕テクノロジーを長年にわたって研究してきた。今週行った私の取材に対してGoogleが答えたところでは、今回ローンチされることになったテクノロジーはここ2年の開発努力の成果だという。

今回のプロジェクトではGoogleは構造化された知識の巨大なデータベースの開発に大いに努力した(2010年にGoogleは有力なセマンティック・データベースのスタートアップFreebaseを買収している)。現在、Googleの知識グラフ・データベースには5億件に上る人物、場所、物事の情報が蓄積されている。さらに重要な点は、この知識ベースにはこれらの対象の相互関係に関する35億件の属性や定義情報が収められていることだ。

“文字列ではなく物事そのものへ”

昨日、GoogleフェローのBen Gomesが私に説明してくれたところによると、Googleはユーザーが入力したテキストが実際に何を探そうとしているものなのか的確に理解することができるようになろうとしている(Gomesは「文字列ではなく物事へ」と表現した)〔訳注〕。これを実現するためにGoogleは自他の無料データベース(Wikipedia、WorldCIA Factbook、自社のFreebaseやGoogle Books、その他通常クローラが収集してくるデータ)に加えて有料の商用データベースも利用しているという(どのデータベースと協力関係にあるのかは明らかにされなかった)。

Category
Tags

No responses yet

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

アーカイブ