2002 Fiscal Year Annual Research Report
パターン照合に基づく情報検索・発見支援システムの開発
Project/Area Number |
02J09184
|
Research Institution | Kyushu University |
Principal Investigator |
平尾 昌啓 九州大学, 大学院・システム情報科学研究院, 特別研究員(DC2)
|
Keywords | パターン照合 / 情報検索 / 発見支援 / 圧縮 |
Research Abstract |
本研究の目的は,インターネット上に氾濫するWEBファイル,研究者によって蓄積された実験データ等の電子化されたデータから,そこに内在するパターンを効率よく発見するためのアルゴリズムの開発を行い,それを実装して計算機実験を行うことを目的としている.ここで対称とするパターンの表現として,どのようなものを採用するかは,パターンの表現力とそれを探すアルゴリズムの実行時間のトレードオフになる重要な問題である. 本年度は,可変長代入を許したワイルドカードを持つパターン(以後VLDCパターンと呼ぶ)に特に着目した.VLDCパターンは,これまでに行ってきた部分文字列パターンや部分列パターンの一般化であり,バイオインフォマティクスの分野でも自然に用いられているモチーフの表現に近い.まず,VLDCパターンの照合を高速化する必要があるので,そのためのデータ構造について,領域計算量と構築アルゴリズムについての考察を行った.その結果,部分文字列パターンや部分列パターンのように領域計算量を線形にすることはできないが,照合に関してはこれまでと同様にパターン長の線形時間で照合が行えることがわかった.また,パターン発見アルゴリズムに関しても,これまでのパターン発見アルゴリズムを拡張することによって,探索時間をそれほど増大させずに最適なパターンを発見できることがわかった.今後,このアルゴリズムを実装してそのパフォーマンスを評価していく予定である.
|
Research Products
(1 results)
-
[Publications] M.Hirao, H.Hoshino, A.Shinohara, M.Takeda, S.Arikawa: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. 292,2. 465-479 (2003)