2012 年度実績報告書

Ｇｌｕｓｈｋｏｖオートマトンの拡張に基づくＰＯＳＩＸ正規表現の効率的照合手法

研究課題

研究課題/領域番号	22500019
研究機関	中部大学
研究代表者	奥居哲中部大学, 工学部, 准教授 (00283515)
研究分担者	鈴木大郎会津大学, コンピュータ理工学部, 准教授 (90272179)
研究期間 (年度)	2010-04-01 – 2013-03-31
キーワード	正規表現 / ＰＯＳＩＸ / パターン照合 / オートマトン
研究概要	POSIX規格では正規表現の照合をおこなう際に，その部分式も含めて最左最長の照合をおこなうように定めている．一方，現在一般に用いられている正規表現照合エンジンは，ごく一部を除き，バックトラックに基づく方式を用いている．このため最左最長照合の効率の良い実行が極めて困難であるという問題がある．さらにバックトラックに基づく方式には，入力によっては照合の計算量が指数的に爆発し手に負えなくなるという問題もある．そこで，バックトラックを用いる代わりに有限オートマトンを用いて部分式を含めた最左最長照合を実現する新たな手法を提案するのが本研究である．本研究の方法は，正規表現の処理で通常用いられることの多いThompsonの非決定性オートマトン（以下，Thompson NFA）ではなくGlushkov（1961）とMcNaughton/山田尚勇（1960）らによって独立に提案されたポジション・オートマトンを独自に改良したものを用いるというものである．元来のポジション・オートマトンでは正規表現の部分式に関する情報が失われてしまうため，ポジション・オートマトンの遷移に部分式の情報をアノテーションとして付加することで，部分式を含めた最左最長照合を実現するアルゴリズムを得ることができた．本研究の主要な成果は以下の通りである．（１）バックトラックに依存せずに部分式を含めた最左最長照合をおこなうアルゴリズム与え，その計算量を明らかにした（特に入力文字列長に関しては線形オーダ）．（２）同アルゴリズムの正当性の厳密な証明を与えた．（３）本研究の方式が貪欲（greedy）照合にも転用可能であることを示し，さらに決定性オートマトン（DFA）への変換によって更なる効率化が可能であることを明らかにした．（４）提案手法に基づく照合エンジンの試験実装をおこない効率化が可能であることを実験的にも検証した．
現在までの達成度 (区分)	理由 24年度が最終年度であるため、記入しない。
今後の研究の推進方策	24年度が最終年度であるため、記入しない。

研究成果
(1件)

すべて雑誌論文 (1件)

[雑誌論文] 決定性有限オートマトンによる正規表現の貪欲な照合2013
- 著者名/発表者名
  奥居　哲，増田　拓也，藤田　佳宏，鈴木　大郎
- 雑誌名
  
  情報科学リサーチジャーナル（中部大学情報科学研究所）
  
  巻: 20 ページ: 97-104