2010年11月25日木曜日

発信者の信頼度で重み付けも、グーグルのリアルタイム検索

 グーグルが米国向けサービスで2009年10月に開始していた「リアルタイム検索」を、日本向けサービスでも開始した。サービスは2月12日から利用可能となっている。Twitterや更新頻度の高いニュースサイトの情報を、数秒から数分という鮮度で検索結果に含める。

 リアルタイム検索のユーザーインターフェイスは2つある。1つは通常の検索を行った後に上部に表示される「検索ツールを表示」をクリックし、左ペインにオプションを表示。ここで「アップデート」や「最新」を指定して検索対象を絞り込む方法だ。

 加えて、通常の検索を行った場合でも、その検索クエリに含まれるキーワードが“ホット”であると判定された場合には、検索結果の一部に小さなウィンドウが区切られ、ここに随時最新情報が流れ込む形でユーザーに提示される。例えば、「常磐線」と電車の路線で検索した場合、通常はWikipediaなどが上位に表示されるが、もし事故による遅延が発生していれば、リアルタイム検索の結果が上位に表示されるようになる。

 2月16日に会見を開いたグーグル 製品開発本部長の徳生健太郎氏は、リアルタイム検索について、その実現のために新たに10以上の技術を開発したという。

 例えば、投稿者のフォロワー数やRT(リツイート)率、引用されている頻度などから投稿者の信頼性を計算し、「ページランクに近いもの」(徳生氏)による重み付けを行っているという。「同じ発言でも、注目されているものもあれば、そうでないものもある」(同氏)。

 リアルタイムに結果を提供するに当たって、リアルタイムのURL解析機能も新たに実装したという。Twitterへの投稿には多くのリンクが含まれているが、こうしたリンクについてフィッシング詐欺など悪質サイトでないかどうかや、発言に関係したページ内容であるか、チェックしているという。

 リアルタイム検索の結果に多く出てくるのは、今のところTwitter投稿が中心だが、Google Buzzにも対応するほか、今後は「Amebaなう」など日本のマイクロブログサービスにも対応していきたいとしている。Twitterからは俗に“ファイアホース”(fire hose)と呼ばれるStreaming APIによるフィードを受けている。フィードの数量や契約条件については未公開だが、こうした特殊なAPIをグーグルやマイクロソフトに提供することが、Twitterの1つの収益源となっていると見られている。パブリックなWeb上をクロールするだけでは得られない効率の良さが、Streaming API利用のメリットだ。

 徳生氏によれば、グーグルが把握しているインターネット上の情報量は6年前で5EB。それが2009年半ばには281EBと60倍にも膨れ上がっているという。こうした大量の情報と、ユーザーからの検索クエリを関連付けるのは、今でも大きな技術的チャレンジであると強調した。

引用元:ロハン(新生R.O.H.A.N) 専門サイト

0 件のコメント:

コメントを投稿