2011 Fiscal Year Research-status Report
高階ナローイングにもとづくXML文書処理の検証技術
Project/Area Number |
23500021
|
Research Institution | The University of Aizu |
Principal Investigator |
鈴木 大郎 会津大学, コンピュータ理工学部, 准教授 (90272179)
|
Co-Investigator(Kenkyū-buntansha) |
奥居 哲 中部大学, 工学部, 准教授 (00283515)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | XML / ナローイング / 正規表現 |
Research Abstract |
今年度行ったことは以下の3つである。1つ目は、XML文書の検証のためのナローイング計算系の設計である。まず、通常の項を扱うナローイングをXML文書のモデルであるヘッジに拡張し、ヘッジを扱う型なしのナローイング計算系を生成した。現在は、XML文書の型を与える正規表現型をもつナローイング計算系を作るために、以前に開発した正規表現型にもとづくマッチングアルゴリズムから単一化アルゴリズムへの拡張を行っている。マッチングアルゴリズムを構成する推論規則を、単一化が可能になるように拡張し、かつ、それを用いたナローイングが完全性をもつようなものを設計しているが、現在のところはまだ完全性が得られそうなものは設計できていない。2つ目は、XML文書の型を与える正規表現のマッチングの高速化に関する研究である。タグを付加したポジションオートマトンを用いた貪欲マッチングアルゴリズムを設計し、そのアルゴリズムをC++で実装し、既存のアルゴリズムとの比較を行った。その結果、既存のアルゴリズムが苦手としているような例では、提案したアルゴリズムが勝る場合があることがわかった。このアルゴリズムは、上記の正規表現型付きナローイング計算系の設計が完了したときに、それを用いた検証系で利用できると考えている。3つ目は、月・惑星探査機のためのデータフォーマットとしてのXMLボキャブラリとそれを使ったシステムの提案である。このフォーマットは現在広く利用されているPDSと呼ばれるデータシステムに格納されたデータを、月・惑星の研究者が自分の計算機上で表示、加工しやすくすることを目指して設計された。なお、このフォーマットそのものは本研究とは直接の関係はないが、検証を行う際のテストベッドのひとつとして考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
以前に行った正規表現型にもとづくマッチングアルゴリズムの単一化アルゴリズムへの拡張に時間がかかっている。マッチングアルゴリズムを構成する推論規則のうち、いくつかを単一化ができるように拡張しているが、マッチングでは生じない技術的な問題が単一化では生じるため、ナローイングの完全性を失わなせてしまうようないくつかの技術的な問題が発生している。さらに、23年度前半終わり頃から年度末にわたって、研究代表者、研究分担者ともにチューリング機械に関する本の執筆作業に携わることになってしまったため、ナローイング計算系の設計にじゅうぶんな時間を取ることができなかったことも影響している。現在は両者ともにその作業を完了させ、研究を再開させている。
|
Strategy for Future Research Activity |
遅れている単一化アルゴリズムの設計を設計する。このアルゴリズムを用いたナローイング計算系が完全性を保証するために、これまでどおり推論規則そのものの取捨選択を進めていくが、それ以外の方策として以下の検討を行う。一つは、推論規則の適用の方法に制限を加えることで完全性を保証する方法を検討する。二つ目は、完全性そのものの要件を緩和する。すなわち、完全性そのものは放棄するものの検証対象となるクラスに対して検証したい性質を調べるにはじゅうぶんな性質(完全性に代わる性質)があるかどうかを検討してみる。いずれの場合も、検証の対象にできるクラスとその性質の範囲にいかなる影響が生じるかを検討する必要があるので、その検討を併せて行う。単一化アルゴリズムの設計からナローイング計算系が定まった後、その完全性、もしくは上で述べたような完全性に代わる性質がこのナローイング計算系について成り立つことを厳密に証明する。また、検証を計算機上で行うためにはある程度の計算効率を確保できるような計算量を担保する必要がある。しかし、推論規則にもとづくアルゴリズムでは、計算量の見積もりが難しいため、設計したアルゴリズムの推論規則を疑似コードに変換したものを作成し、その上で計算量を見積もる。疑似コードによるアルゴリズムの記述の際には、23年度に行った正規表現の貪欲マッチングアルゴリズムで作成した疑似コードを参考にする。ただし、先行研究から考えて多項式時間の計算量が得られる見込みは薄いと思われる。非多項式時間の計算量の場合は実際の対象によって大きく計算時間が変わってくるため、計算機による計算時間の計測も併せて行う。
|
Expenditure Plans for the Next FY Research Funding |
研究のスピードをあげるため、研究代表者と分担者の間の研究打ち合わせを密に行いたい。そのため、打ち合わせのための旅費に研究費を使用する。また、研究の参考となる先行研究について調査するための調査研究旅費、文献の購入に研究費を充てる。また、疑似コードで記述したアルゴリズムをマルチコアをもつ計算機で実行し、それにかかる時間を計測するためのプログラムを記述する際に用いる、プログラム開発環境ソフトウェアの更新にも研究費を使用する(マルチコアをもつ計算機は既存のものを利用するため、その購入のために研究費を使用する必要はない)。それ以外に、研究成果発表旅費と会議参加費に研究費を使用する。
|