本研究では、オントロジー情報などの背景知識を考慮することで、より知的な文字列照合を行うアルゴリズムの開発を目指している。具体的には、電子的に利用可能な分類階層データベースやシソーラス情報、文章構造といったオントロジー情報を利用して動作する照合アルゴリズムを開発し、それらの統合を行う。また、それ以外のオントロジー情報についても調査を行い、知的検索のための利用を模索する。申請者はこれまでに分類階層情報を考慮した文字列照合アルゴリズムに加え、Arc情報が付加された文字列照合アルゴリズムについて取り組み、それぞれ有効なアルゴリズムを得ている。 本年度は、構造を伴ったテキストに対して、効率よい検索を行うための索引構造についても研究を行い、ある種の区間情報(プロパティ)が付随する文字列に対して効果的に索引付けできるプロパティ付き接尾辞木の効率よい構築アルゴリズムの開発に成功した。一方で、近年、大規模な数値データストリームに対する高度な検索が重要視されはじめたことから、大規模データストリーム上での時系列パターン照合問題にも取り組んだ。その結果、多次元の数値データストリームに対して、各次元間に相関がある複雑なクエリに対して効率よいアルゴリズムを提案した。
|