2003 Fiscal Year Annual Research Report
新鮮な情報検索のためのスケーラブルな分散型サーチエンジン
Project/Area Number |
14780242
|
Research Institution | Toyo University |
Principal Investigator |
上原 稔 東洋大学, 工学部, 助教授 (70256775)
|
Keywords | 情報検索 / サーチエンジン |
Research Abstract |
本年度の成果は以下の通りである。 1.スケーラビリティの確立 分散サーチエンジンの問題点であった検索時の通信遅延を解決するため、様々な検索高速化技法を開発した。この結果、サイト数Nのネットワークにおいて、平均的な場合0(1)、最悪の場合0(N)で検索可能となった。ただし、最悪の場合においても想定されるインデックスの更新間隔を超えることはない。 この成果は国際会議にて3件発表した。 2.適応的インデクサの開発 文書の収集とインデックスの作成をパイプライン方式で行い、動的にパイプラインを再構成する手法を開発した。これにより適応的にインデックスを作成することができるようになった。 この成果は国際会議にて2件発表した。 3.Word Spammingに強いランキング法の開発 分散計算に適さないPageRankの代わりにTF・IDFのTFを文書の更新頻度に基づき鮮度を考慮したFTF(Fresh Term Frequency)に拡張することでWord Spammingに強いランキング法を提案した。 この成果は国際会議にて3件発表した。 4.耐故障性 我々の方式ではメタ情報を集中処理する。そのためメタサーバが単一故障点となる。そこで、メタサーバを複製し、分散化することで耐故障性を高めた。 この成果は国際会議にて2件発表した。 5.組織内文書の保護 分散サーチエンジンの利点は文書を分散して管理できることにある。そのため組織内文書の検索に適する。しかし、組織内文書は公開・非公開の制御などアクセス制御が必要とされる。 この成果は国際会議にて1件発表した。
|
Research Products
(1 results)