研究概要 |
内部にプログラム,データ,計算の状態を含むオブジェクトを,ネットワーク環境上で,厳格な計算機資源アクセス管理下のもとで移動・実行可能としたものをモーバイルオブジェクトと呼ぶ.本研究では,モーバイルオブジェクト技術をWeb検索システムする際の分散並列問題に関する探求と,その方法に基づいたシステムの設計と実現を行った. まず,モーバイル化されたWeb検索ロボットが繰り返し的に集めてくるデータを用いて,検索インデックスを構築し,高速な全文検索を可能とする方式の設計と実現を行った.全文検索インデックスとしては,suffix arrayと呼ばれるデータ構造を用いた.suffix arrayはコンパクトなインデックス構造でありながら,全文検索を可能とするという特長を有するが,更新が容易でないという短所をもつ.我々はsuffix arrayをインクリメンタルに更新する方式を新たに開発することにより,この短所を解消する方法を開発した. インクリメンタルな更新方式では,差分のsuffix arrayを作るのは高速だが,既存のsuffix arrayに差分のテキストから作成したsuffix arrayをマージしたり単一のsuffix arrayを再構成する処理のコストが大きい.そこで,suffix arrayを分割して複数のサイトに配置して,上記のインクリメンタルな更新処理と検索処理を分散並列処理し,両処理を高速化する方式を開発した.
|