2011 Fiscal Year Annual Research Report
木構造データに対する汎用性の高い類似度計算技術の開発
Project/Area Number |
21700178
|
Research Institution | Doshisha University |
Principal Investigator |
深川 大路 同志社大学, 文化情報学部, 助教 (10442518)
|
Keywords | 木構造 / 類似度計算 / 近似パターン照合 / アルゴリズム |
Research Abstract |
本研究は、木構造によって表現され得る様々なデータを対象に、近似パターン照合や類似度計算を効率良く行うための汎用的な枠組みとアルゴリズムの提案および実装を目指している。昨年度までと同様、目標達成へのアプローチとして主に離散アルゴリズムと計算量の理論を用いた研究を進め、研究代表者および外部の共同研究の既存の研究を発展させた。研究計画の3年目にあたる平成23年度は、昨年までに開発した厳密アルゴリズムの改良を目指し研究を進めた。既存アルゴリズムは類似度の高いデータ対に対して正確な類似度計算を高速に行うことができるものであったが、新たに開発したアルゴリズムによって、データ間の類似度が低い場合であっても効率良く類似度計算を行うことができるようになった。これにより、さらに広い範囲のデータに対して効率的な類似度計算を行うことができるようになった。特にラベルや次数を固定した場合においては、(1+ε)n時間で計算できることが分かり、既存の結果を大幅に改良した。実装においては、京都大学化学研究所KEGGデータベースで提供されている糖鎖データを対象に計算機実験を実施した。計算機実験にあたっては、最大クリークを用いたプログラムをさらに改良し、動的計画法を組み合わせて利用する実用的アルゴリズムを開発した。実験の結果、糖鎖データの類似度計算の実行時間において昨年度のプログラムと比較して大幅な改良が見られた。これにより、今後データベースにおいて類似度テーブルの更新する際の計算コストを大幅に下げることが可能になった。現在、共同研究者らとともに既存の結果に最新の結果を加えた論文を準備中であり、また、プログラム公開に向けて準備を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
アルゴリズムの開発については毎年新たな発想に基づく結果が出ており、計画以上に順調な進展があるといえる。実装の公開については計画より若干遅れているが、準備を進めており、目的は十分に果たされるものと考える。以上より、全体的にはおおむね順調に進展しているものと考える。
|
Strategy for Future Research Activity |
実装が進まなかった主たる要因は、これまでは十分な時間をとることができなかったことであると考えている。限られた時間の中で確実に成果を出すべく、共同研究者らが進めている計算機実験の結果も参考にしながら、本課題の目的である汎用性を重視したプログラムの開発を目指す。
|
Research Products
(2 results)