2013 Fiscal Year Annual Research Report
Project/Area Number |
23500110
|
Research Institution | University of Tsukuba |
Principal Investigator |
鈴木 伸崇 筑波大学, 図書館情報メディア系, 准教授 (60305779)
|
Keywords | 構造化文書 / XML / スキーマ進化 |
Research Abstract |
まず,前年度に引き続いて,正規木文法の差分抽出アルゴリズムの評価実験を行い,本アルゴリズムによる出力の妥当性を確認した.次に,開発したアルゴリズムの応用可能性を検証するため,スキーマ進化に応じたXPath式修正アルゴリズムの開発を行った.このアルゴリズムは,スキーマ進化によって,XPath式が更新後のスキーマに関して妥当なものではなくなった場合に,XPath式を更新後のスキーマに対して妥当,かつ,可能な限り同じ検索結果が得られる式となるように修正するものである. アルゴリズムの概要は次の通りである.まず,スキーマ進化が起こった場合に,本研究で開発した差分抽出アルゴリズムを用いて,更新前のスキーマと更新後のスキーマとの間の差分(更新操作列)を求める.次に,この更新操作列と入力XPath式を照合し,入力XPath式をどのように修正したらよいかを特定し,XPath式を修正する.ここで,スキーマ進化によって要素の削除が行われていた場合,検索対象の要素が消失することがあり,その場合はスキーマ進化前と同じ検索結果を得ることは不可能である.その場合,スキーマ進化前に検索されていた要素のうち,消失していないものが検索されるようなXPath式への修正を行う. 得られたアルゴリズムを計算機上に実装し,評価実験を行った.使用したスキーマは MSRMEDOC DTDs (version 2.1.1 and 2.2.2)および NLM Journal Publishing Tag Set Tag Library DTDs (version 2.3 and 3.0)である.また,本実験に使用したXPath式として,XPath式生成ツール XQgen から生成されたものを用いた.その結果,使用したいずれのスキーマにおいても,XPath式の修正が適切に行われていることが分かった.
|