ネットビジネスで企業したい!
若いうちにリタイアしたい!
アフィリエイトで稼ぎたい!
そんなあなたのために、稼ぐためのアフィリエイト情報を隠すことなく提供します!
検索エンジンが「ユーザーのその日の気分」を知る方法
少々きになる記事を発見しました。
もうすでにご存知の方もいるかもしれませんが、SEO対策を研究する上で知っていても損はないだろうと思い、ここに乗せてみました。
参照元 ITMEDIAより
少し古い話になるが、CNETに『パーソナライズド検索、グーグルが探し当てていない正解とは』という記事が掲載された。この記事の意味するものは、かなり重要だ。
個人の好みを完全に把握するには、単なるキーワードからの推測の域を超えて、その人が検索を実行しようとしている瞬間の意向をとらえる必要がある。時間が経っても変化しない振る舞い(例えば節約志向か贅沢志向か、冒険派か慎重派かなど)に加えて、そのときどきによって変化する振る舞い(新型コンピュータの購入、プロジェクトのリサーチ、休暇の計画など)も考慮するのが、本当の意味でパーソナライズされた検索というものである。個人のオンライン上での最近の振る舞い(可変要素)と個人の人物履歴とでもいうべきもの(不変要素)を組み合わせれば、その人の本当の好みと検索時点での意向を汲み取るためのコンテクストを検索エンジンに渡すことができる。
インターネットのフラット化革命は、コンテンツや商品、人間関係などネット空間に転写されるすべての情報を、ひとつの大きなフラットな土俵の中に上下関係なしに並べてしまった。ユーザーはその玉石混淆の情報の大海原の中から、求める情報を的確に救い出さなければならなくなった。
1990年代のWeb1.0の時代においては、そういう「玉石混淆から玉を選び取る」方法は個人の能力に帰結すると考えられ、それがインターネットリテラシーという言葉で呼ばれていた。しかし冷静かつ客観的に考えれば、そんなことをごく普通のインターネットユーザーが行うのは、不可能に近い。ひとりの個人にとってはそもそも、インターネット上にあるすべての情報にりーちすることさえできないし、その中からどのような基準で、どのようなガイドラインに沿って求める情報をすくい上げればいいのか、その手法さえさだかではない。
そこで90年代の終わりから、その「玉をすくい上げる」方法を何らかのアーキテクチャーで行えないだろうかという考え方が、徐々に生まれてきた。
Web検索エンジンの登場と変遷
その最初の試みが、検索エンジンだった。
世界で最初のロボット型検索エンジンは、1994年1月に有料でスタートした「Infoseek」だった。有料では顧客はなかなか集まらず、その年の夏には無料サービスに移行している。この同じ年の4月には、後に「Yahoo!」の創設者となるジェリー・ヤンとデビッド・ファイロがディレクトリの原型となるリンク集を公開している。すべての原点は、この1994年という年から始まったと言っていいだろう。
しかし黎明期のこの時代、検索エンジンの代名詞のように語られたのは、DEC(Digital Equipment)のラボラトリで開発された「Altavista」だった。1995年にサービスインしたYahoo!が、公式の検索エンジンとしてAltavistaを採用したからだ。また95年10月にサービスを開始した「Excite」もかなりの人気を集めていた。「Magellan」や「Webcrawler」といった検索エンジンもあった。だがこうした企業の多くは、今ではほとんどが姿を消してしまっている。MagellanとWebcrawlerは後にExciteに買収され、そのExciteも2002年に倒産。日本法人だけは生き残って伊藤忠商事の子会社となり、検索エンジンから若者向けのポータルサイトへと変わっている。
またAltaVistaは、Yahoo!が「Inktomi」に乗り換えるのと同時に力を失い、DECがCompaqと合併するとともに切り離され、その後Overtureに買収された。そのInktomiもその後、Yahoo!がGoogleに乗り換えることで破たんの危機に瀕したが、やがてYahoo!とGoogleが決裂するに及んでYahoo!に買収される結末となった。
世界初の検索エンジンだったInfoseekは、親会社であるDisneyによって閉鎖され、日本法人だけが“インフォシーク”の名称を引き継いで生き残った。日本法人は2000年に楽天に買収され、その後ライコスと統合し、現在は楽天のポータル戦略の一環として生き延びている。しかし独自の検索エンジン開発はもはや行っていない。
データベースとアルゴリズムの競争
このように初期の検索エンジンの歴史を振り返ってみると、その合従連衡の激しさにあらためて驚かされる。まさに死屍累々、弱肉強食の世界だったのだ。黎明期の検索エンジンには、2つの大きな競争があった。ひとつはインデックスを他社よりも巨大化させ、Web世界をいかにして覆い尽くすかというデータベース構築競争である。世界中に存在するWebページの数は爆発的に増加し続け、時でもすでに数十億ページにまで達していた。その爆発に検索エンジンは追いつかなくなっており、検索結果に漏れが大量に生じていたのである。
そして2つ目の競争は、ユーザーからの検索クエリーに対していかに適切に回答を返すかというアルゴリズム競争だった。初期の検索エンジンはきわめて貧弱なアルゴリズムしか持っておらず、SEO(検索エンジン最適化)スパムと呼ばれる悪質な手口に振り回された。どんなキーワードで検索しても、必ず検索結果上位に特定のポルノサイトやカジノサイトなどが表示されるという、信じがたい事態にまで陥ったこともあったのである。
Googleの勝利とその先
そうした混乱の状況が続く1998年、彗星のように登場してきたのがGoogleだったのである。次の章で詳述するが、Googleはこの2つの競争において、圧倒的な技術的勝利を収めたのである。データベース構築競争においては、Googleは分散モデルを導入することで、データベースのスケーラビリティーを徹底的に推し進めた。1台のスーパーコンピュータで処理するのではなく、大量のマシンを使う分散システムを考え出したのだ。同社のCEOであるエリック・シュミット氏は後に「高性能CPUではなく、より安価で小さなプロセッサを大量に購入して構築する方が、データベース構築には現実的だ」と述べている(Always Onのインタビュー記事より)。これらの安価なマシンを使った数百台のサーバから、数万のHTML収集クローラーが送り出され、同時並列にWebページの収集を行い、これを数万台から数十万台とも言われるマシンに処理させるというものである。
またアルゴリズム競争においても、Googleは「ページランクテクノロジ」と呼ばれる技術を導入することで、検索結果に圧倒的な公平性と正確さを与えることに成功した。だがここに来て、冒頭に紹介したCNETの記事にもあるように、検索エンジンの新たな地平を模索する動きも出てきている。
アルゴリズムによる検索エンジンというのは、つまりは徹底的に「神の視点」から集合知を集約していくことであり、Webの世界を知識データベース化したうえで、それを最大公約数的なマクロの視点から抽出していこうという考え方に基づいたものだ。
しかし一方で、そうしたマクロの引力とは別に、ミクロの引力も存在する。つまりはあるユーザー個人がどのような情報を求めて、検索エンジンを使おうとしているのかを探り当て、そのニーズに徹底的に答えていこうという方向性だ。
履歴も利用するパーソナライズ検索
そのひとつの回答が、Googleのパーソナライズ検索だ。ITmedia Newsの2005年11月11日の記事、『Google、パーソナライズ検索を正式版に』にはこう説明されている。
このサービスは、以前の検索クエリーに基づき、ユーザーの好みに合わせてGoogleの検索結果を調整するというもの。Googleアカウントを持つユーザーなら誰でも利用できる。
同サービスは検索履歴とクリックされた検索結果から学習し、ユーザーにとって重要と判断した検索結果を上位に持ってくる。例えば、最近iPodアクセサリを検索したユーザーが「apple」というキーワードを検索すると、Apple Computerに関連する検索結果がリンゴに関連する検索結果より上位に表示されるとGoogleは説明している。
またPersonalized Search正式版には、「Bookmarks & Searchable Labels」「Remove Results」という新機能が追加されている。前者は、ブックマークの作成や、検索履歴の項目に検索可能なラベルや注釈を付けることができる機能。後者は、不要な検索結果を今後の検索から排除できる機能だ。1回の検索または今後のすべての検索から、Webページあるいはサイト全体を排除することができる。
しかし冒頭に紹介したCNETの記事は、この「検索履歴とクリックされた検索結果から学習」しただけでは、ユーザーがどのような検索をしようとしているのかをダイレクトに知るための材料としては、不足しているのではないかと指摘しているわけだ。
もちろん、パーソナライズ検索の分野では、単純にユーザーの過去の履歴だけを材料にしているわけではない。たとえばAmazon.comで書籍などを購入したとき、購入画面で表示される「この本を買った人はこんな本も買っています」というシミラリティー(類似)機能は、協調フィルタリングと呼ばれる手法を採用している。これは、ある特定のユーザーAと過去の行動が類似している他のユーザーBが好むもの、購入したものは、ユーザーAにとっても有用である可能性が高いという概念に基づいて、情報をフィルタリングする手法である。過去の行動が似ているユーザー同士を動的にグループ化していくことによって、そこからデータマイニングする方法と、複数のユーザーの過去の行動からさまざまな情報の相関関係を見つけ出し、その相関関係から有用な推薦データを見つけていくという情報オリエンテッドな手法の2つがある。
過去の検索に出てこない情報をどうするのか
だがいずれにせよ、ユーザーの過去の行動からデータマイニングを行っているということには、変わりはない。だが本当に過去の履歴だけで、その人の今の考え方がわかるのか?――という疑問がある。
たとえば「バス」という検索キーワードを考えてみる。バスには釣りの対象になっている魚のバスもあれば、乗用車のバス、風呂のバスもある。日本語ではすべて同じ「バス」だ。バスフィッシングが趣味のユーザーが、釣りに行く前に必ず魚のバスの情報を検索エンジンで調べていたとすると、パーソナライズ検索では魚のバスについてのURLが検索結果ランキングの上位に表示されるようになる。
だがこのユーザーは、その日妻に急かされて、前からほしいと思っていたお風呂グッズをネット通販で買おうと思っていたのかもしれない。あるいは、テレビの旅行番組で房総半島のバスツアーが紹介されているのを見て、自分も行きたくなったのかもしれない。いや、テレビで旅行番組は見ていなかったけれども、単にその日の気分が鬱々としていて、「たまには気分晴らしにバス旅行にでも行ってみたい」と旅情をかきたてられたのかもしれない。しかし過去の履歴だけでは、そうした「他からの影響」「その日の気分」などは、まったく考慮に入れられない。
ではそうした外界からの影響や、本人の内なる精神的志向などをパラメーター化し、情報収集の精度を上げる方法はないのだろうか?
この分野は、かなり未知の世界だ。しかし未知だからこそ、金鉱も埋まっている。日本のネットベンチメ[の中にも、こうした分野に何とか挑もうと考える企業がいくつか生まれてきているのだ。
日時: 2006年10月06日 14:12|パーマリンク
トラックバック
このエントリーのトラックバックURL:
http://www.aff-info.com/sbs/mt-tb.cgi/10