従来型のWeb検索エンジンは、インターネット世界の0.2%(DeepDyve社の発表)しかインデックス化していないという。残りの99.8%は、会員限定のクローズドなコンテンツであるため、あるいは他のサイトからのリンクが少ないために検索エンジンにクロールされずにいる。これを Deep Web (ディープ・ウェブ)と呼ぶ。



<p>DeepDyve は、コンテンツの提供者と組んでこの Deep Web を検索できるようにした。コンテンツ提供者側にとって、コンテンツへのトラフィックが増えるメリットがある。</p>

<p>現在は、無料会員登録ユーザーと、月45ドルの有料会員の2つが設けてある。コンテンツそのものは有料であるようだ。iTunesのようなコンテンツ販売ビジネスを目指している模様。</p>

<p>従来、このような有料のクローズドコンテンツは、それぞれのサイトで販売されてきた。検索方法もサイト毎にバラバラだし、サイト横断的に検索することもできない。その窓口を一つにしたもの、つまりクローズドコンテンツのポータルサイト的なものということなのだろう。音楽の世界ではiTunesがその座を射止めたが、科学論文や特許の分野で同様の立場を得るつもりらしい。</p>

<p>コンテンツをインターネットで配信する場合、一昔前は、企業は有料モデルを展開していた。しかし、優れた無料コンテンツがあふれる中で有料コンテンツの相対的優位性が薄れ、そして検索エンジンがオープンコンテンツのみを対象にしているため、ポータルや検索エンジンから自社サイトの無料コンテンツに誘導し、広告モデルでの収益を目指すのが現在の主流となった。しかし、検索エンジンがDeep Webをも対象にすることで、再び有料コンテンツの配信によって収益を得るビジネスモデルが復活可能になるかもしれない。</p>

<p>技術的には、KeyPhrase というゲノム解析由来のアルゴリズムによる検索が特徴。KeyPhrase の詳細は不明だが、バイオインフォマティクスでは、遺伝子配列の断片から、それに類似した遺伝子配列を検索するというホモロジー検索が一般的に行われている。機能が未知の配列が、機能が既知の配列に似ているならば、未知の配列の機能は既知の配列の機能に似ていると推測できる。</p>

<p>入力となる遺伝子配列は、ウェブ検索エンジンへの入力キーワードに比べればはるかに長い。バイオインフォマティクスの分野では、長年このような技術を磨いてきた。そういえば、『集合知プログラミング (Programming Collective Intelligence)』の Toby Segaran も、大学はMITのコンピュータサイエンス学科であったが、卒業後に興した会社はバイオ関係であった。Webの世界、集合知、バイオインフォマティクスを結びつけると、そこには宝が眠っていそうだ。</p>

<p>DeepDyve は 2008/11/11 に Infovell から名前を変えたばかり。より解り易い名前になったといえる。</p>

<p>
ゲノミクス研究から誕生、「ディープ・ウェブ」を検索するエンジン『DeepDyve』

http://wiredvision.jp/news/200811/2008111322.html



Deep Dyve
http://www.deepdyve.com/



Infovell Changes Name to DeepDyve, Rolls Out Consumer Search Engine for the Deep Web

http://biz.yahoo.com/prnews/081111/aqtu059.html

</p>