2017 Fiscal Year Annual Research Report
New developments in string processing based on combinatorics and advanced data structures
Project/Area Number |
26280003
|
Research Institution | Kyushu University |
Principal Investigator |
稲永 俊介 九州大学, システム情報科学研究院, 准教授 (60448404)
|
Co-Investigator(Kenkyū-buntansha) |
坂内 英夫 九州大学, システム情報科学研究院, 准教授 (20323644)
田部井 靖生 東京工業大学, 情報理工学院, 研究員 (20589824)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | アルゴリズム / NP完全性 / 文字列データ処理 |
Outline of Annual Research Achievements |
本研究課題の目的は,文字列組み合わせ論と高度データ技術により,効率的な文字列データ処理技術を開発することにある.ここでは特に,順序同型照合と呼ばれる,文字の相対的な順序に注目したパターン照合問題を取り扱った.例えば,X = (35, 40, 23, 40, 40, 28, 30) と Y = (7, 9, 2, 9, 9, 5, 6) について,それぞれの要素の辞書式順序列を R(X),R(Y) と書くことにすると,R(X) = R(Y) = (4, 5, 1, 5, 5, 2, 3) であるので,X と Y は順序同型合致するという. 長さ n のテキスト文字列 S と長さ m のパターン文字列 P が与えられたとき,P と順序同型合致する S の部分文字列をすべて求める問題は,O(n + m) 時間,O(m) 作業領域で解けることが知られている. 本研究では,より一般的な問題として,サイズ N のテキスト木 T と長さ m のパターン文字列 P が与えられたとき,P と順序同型合致する T 中のパスをすべて求める問題を考え,これを O(N + m) 時間,O(m) 作業領域で解くアルゴリズムを与えた.順序同型ボーダ配列に基づく KMP 型オートマトンと呼ばれるデータ構造を用いることにより,この成果を実現した.また,より一般的な問題として,テキストが DAG (非巡回グラフ) で与えれる場合を考える.これについて,P と順序同型合致するパスの存在判定問題が NP 完全であることを示した.
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|