研究課題/領域番号 |
23700022
|
研究機関 | 九州大学 |
研究代表者 |
稲永 俊介 九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 文字列情報処理 / アルゴリズム / データ構造 |
研究概要 |
文字列とは,記号の連鎖のことである.コンピュータ上で取り扱うデータの多くは,文字列とみなすことができる.そのため,文字列データを高速かつ省領域で処理する基盤技術の開発は,情報爆発時代における喫緊の課題となっている.本研究では,テキストTとパターンPの2つの文字列が与えられたとき,TにおけるPの出現位置を求める文字列照合問題を取り扱う.特に,パラメタ化文字列照合問題という,文字の置換を許した照合問題に対する高速なアルゴリズムの開発に取り組む.文字列X中の文字を置き換えることで,文字列Yと合致するとき,文字列XとYはパラメタ化合致するという.パラメタ化文字列照合問題とは,テキスト文字列Tとパターン文字列Pが与えられたとき,PがT中でパラメタ化合致する位置の集合を求める問題である.パラメタ化文字列照合は,ソフトウェアメンテナンスや盗作検出,RNA配列の2次構造照合など,計算機科学やバイオ情報学の重要課題の基盤となるものである.しかしながら,素朴な方法では,パラメタ化文字列照合問題を解くために膨大な時間を要してしまう.今年度は,パラメタ化文字列照合問題と密接な関係を持つ,回文照合問題に取り組み,これを高速に解くアルゴリズムの開発に成功した.既存研究において,アルファベットサイズが3以下のとき,回文照合問題を線形時間で解くアルゴリズムが提案されていたが,より大きなアルファベットサイズにおいては,効率的な手法は知られていなかった.本研究では,これを線形時間で解く世界初のアルゴリズムの開発に成功した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究実績の概要で述べたとおり,任意のサイズのアルファベットに対して,回文照合問題を線形時間で解くアルゴリズムの開発に成功している.このアルゴリズムの実行時間は,理論的にはこれ以上の高速化が望めない最適なものである.パラメタ化文字列照合と同様に,回文照合もまたRNAの2次構造発見等への応用が可能である.しかしながら,既存の回文照合手法はアルファベットサイズが3以下の場合にのみ適用可能であり,アルファベットサイズが4であるRNA配列に適用できないという課題があった.本研究の成果は,この課題を正面から解決したものであり,その意義は極めて大きい.
|
今後の研究の推進方策 |
次年度以降は,圧縮された文字列データ上で高速に動作するアルゴリズムの開発を行う.圧縮データを陽に展開することなく,様々な処理を行うことができれば,データの保存領域の大幅な節減に繋がる.また,圧縮データに内在する組み合わせ的性質を利用することで,領域の節約だけでなく,処理時間の高速化をも達成できる可能性がある.
|
次年度の研究費の使用計画 |
圧縮データ上で動作する高速アルゴリズムの開発のために,既存技術の徹底的なサーベイを行う.当該分野の第一線で活躍する研究者が集う会議に積極的に参加し,最新の研究成果を網羅するとともに,新技術開発のためのディスカッションを行う.このため,国際会議参加や研究打ち合わせを目的として,数度の海外出張を予定している.また,東北大学の共同研究グループとの研究打ち合わせや,国内の会議への参加も積極的に行う予定である.研究成果をまとめるために,計算機や周辺機器の購入も適宜行う予定である.
|