研究概要 |
記号計算における要素技術のひとつであるパターン照合は,複雑なアルゴリズムの簡潔なルールによる記述を可能にする.このようなルール指向のプログラミングはXML文書の統合・変換においても極めて有効であることがHosoyaとPierceらによる言語Xduce等により示されている.しかしXduceにおいて導入された正則表現型(regular expression types)は文脈のパターン照合を許していない.このため,文脈に依存する処理のルール記述が複雑になるという問題がある.そこで,高階のパターン照合(およびその一般化である高階ナローイング)を導入することで,XML文書の統合・変換処理の記述をより容易にしようというのが本研究である.本研究では,まず,正則表現型を拡張した不完全正則表現型(incomplete RE types)と呼ぶ新たな型システムを導入し,これにより従来の正則表現型と整合性をとりつつ文脈を表現する型の記述を可能にした.また,良形な(well-formed)型を検査するためのアルゴリズムを与えた.次に,XML文書(とその文脈)を不完全正則表現型の式とみなしパターン照合を行うアルゴリズムを構築した.このアルゴリズムは,5つの簡単な変換規則の組として記述される.各変換規則は不完全正則表現型の式をトップダウンに分解しつつ解代入を段階的に生成する.同時に,非決定性トップダウン木オートマトンの遷移の1ステップをシミュレートし,型の段階的な検査を行う.このために,Brzozowski derivativesとして知られる正則表現の展開手法を不完全正則表現型に拡張した.アルゴリズムを変換規則の組として与えたことにより,パターン照合の戦略(最長照合等)と曖昧さの問題を基本的なアルゴリズムと分離して取り扱うことが可能になった.本アルゴリズムは健全かつ完全である.すなわち,生成される解はすべて正しい解であり,逆に正しい解の基底集合の要素はもれなく列挙される.この厳密な証明を与えた.現在,本アルゴリズムの高階ナローイングへの拡張に着手している段階である.
|