本研究は、木構造によって表現され得る様々なデータを対象に、近似パターン照合や類似度計算を効率良く行うための汎用的な枠組みとアルゴリズムの提案および実装を目指している。昨年度と同様、目標達成へのアプローチとして主に離散アルゴリズムと計算量の理論を用いた研究を進め、研究代表者および外部の共同研究の既存の研究を発展させた。研究計画の2年目にあたる平成22年度は、これまでに得られた研究成果を別の視点から評価するために、人工データや実データに対して適用可能なプログラムを作成し、計算機実験によってアルゴリズムの有用性を確認した。木類似度および編集距離の計算はNP困難であることから、これまでにいくつかの高速な近似アルゴリズムを提案してきたが、それらの近似性能を実験的に評価するためには与えられたデータの最適解を知る必要がある。そのために、まずは厳密アルゴリズムの開発を行った。一般に厳密アルゴリズムは効率の面で近似アルゴリズムを上回ることはないとしても、最適解を厳密に求めることが可能になれば、実験的評価のためだけでなく高精度検索などの用途にも活用できる可能性があり、有用性が高いと考えられる。新たな厳密アルゴリズムの提案を行う一方、別のアプローチとして、最大クリーク問題への帰着を利用する厳密アルゴリズムを開発した。この手法は最大クリーク問題に対する高速ソルバーを活用することができるため、汎用性が高いといえる。後者の手法は、人工データや実データに適用し、有用性を確認した。
|