研究概要 |
研究課題『文字列学理論に基づいた高速知識発見システムの開発に関する基盤研究』において,本年度は主に以下の成果を達成した. 1.圧縮文字列上のパタン照合の高速化 2.文字列間の類似性計算の高効率化 3.ゲノムデータ処理のための高速アルゴリズムの開発 成果1に関しては,喜田らが提案した可逆的圧縮技法に対する統一的枠組みであるコラージュシステムの部分クラスに対して,従来のアルゴリズムよりも高速かつ省領域で動作するパタン照合アルゴリズムを提案し,計算機科学基礎に関する国際ジャーナル(International Journal of Foundations of Computer Science)に発表した. 成果2に関しては,文字列の柔軟な更新に対応可能な,最長共通部分文字列(Longest Common Subsequence, LCS)計算アルゴリズムを提案し,第15回計算理論基礎に関する国際会議(FCT'05)に発表した.このアルゴリズムは,二つの入力文字列を左右いずれの方向に更新する場合においても,線形時間でLCSの更新を行うことができる画期的なものである. 成果3に関しては,ポリメラーゼ連鎖反応(Polymerase Reaction Chain, PCR)なるDNAの特定部位増幅技法に使用される,プライマー組の候補を高速かつ省領域で発見するアルゴリズムを提案し,第12回文字列処理と情報検索に関する国際会議(SPIRE'05)に発表した.また,文字列と数値の組を要素としてもつ二つの集合(正例と負例)が与えられたとき,正例と負例を最も端的に区別するパタンをO(N^2)時間で求める,機械発見アルゴリズムを提案した.ここで,Nは正例と負例に含まれる文字列の長さの総和である.この研究成果は,第8回発見科学に関する国際会議(DS'05)に発表した.
|