研究概要 |
大量データ処理のための領域効率のよいアルゴリズムとデータ構造の開発を行った.まず,文字列の高速検索を行うデータ構造として,すでに圧縮接尾辞配列が提案されているが,その拡張として,二次記憶での実装や分散環境に適したものを提案した.これにより,より大量のデータに対する検索を高速に行えるようになった. 次に,複数の文字列の検索が可能なデータ構造を提案した.この問題はdynamic dictionary matchingと呼ばれ,複数の文字列パタンが与えられたときに,それに対する索引を作成し,問い合わせとしては1つの文字列に対してその中のどの位置にパタンが現れるかを求めるものである.この問題に対し,効率的な索引更新アルゴリズムおよび検索アルゴリズムを提案した.必要スペースはパタン長に比例する. また,Web検索の効率化のために,Webページのスコア付け法を考案した.Googleで用いられているスコア付け法は,Web全体に対するスコア付けとしては良いものであるが,1つのWebサイトの中のページのスコア付けとしてはうまくいかない.よってそのような場合にうまくスコアを定義する手法およびそのスコアの効率的な計算法を提案した. その他に,アドホック無線ネットワークにおける省エネルギーブロードキャストアルゴリズムや,並列計算における効率的な局所探索法,生物の進化系統樹の計算など,大量データ処理に関する研究を行った.
|