研究概要 |
木,グラフ,超グラフといった離散構造における類似度・非類似度の計算のうち,本年度は,主に木の非類似度である木の編集距離とその応用についての研究を進めた 木構造の非類似度として最も広く用いられている木の編集距離は、この兄弟間の順序を考慮する順序木ではノード数nの木に対して計算に0(n^3)時間かかり、兄弟間の順序を考慮しない無順序木ではNP困難でありMAX SNP困難であることが知られている そこで本年度はまず,編集距離の変種の一つであり,Valienteによって定式化力・意図されていた共通完全部分木に基づくボトムアップ編集距離について研究を進めた.Valienteの定式化ではラベルの置換を許していないため,厳密には編集距離ではなくインデル距離であった.そこで,新たにボトムアップ編集距離を定式化し,順序木では0(n^2)時間で計算するアルゴリズムを設計するとともに,無順序木ではMAX SNP困難になることを示した また,本年度は,順序木の編集距離τを二分木コードの文字列編集距離δによる近似にも取り組んだ.そして,0(n^2)時間で計算でき,かつ,(τ-h)/(h+1)≦δ≦2τで近似することを示した.無順序木で同様の高速近似手法を確立することは今後の課題である さらに,本年度は、インフルエンザウイルスの系統樹、および、薬剤感受性検査データから得られる菌交代や耐性変化を表す有向グラフであるエピソードを求める技術を発展させた.今後は,これらの木やグラフの類似度・非類似度の計算方法を確立することが課題である
|