半構造XMLデータからのスキーマ抽出及び変換アルゴリズムの開発

Research Project

Project/Area Number	14780330
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	情報システム学(含情報図書館学)
Research Institution	Okayama Prefectural University
Principal Investigator	鈴木伸崇岡山県立大学, 情報工学部, 助手 (60305779)
Project Period (FY)	2002 – 2003
Project Status	Completed (Fiscal Year 2003)
Budget Amount *help	¥3,100,000 (Direct Cost: ¥3,100,000) Fiscal Year 2003: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2002: ¥2,600,000 (Direct Cost: ¥2,600,000)
Keywords	XML / データ変換 / スキーマ抽出 / アルゴリズム
Research Abstract	本研究のスキーマ抽出は,構造の類似したXMLデータ同士を同じクラスに分類し,同じクラスに属するデータを共通の構造に変換する,という手順で行われる.これを実現するため,本研究では構造の異なる2個のXMLデータを同じ構造に変換(この処理を以下では併合と呼ぶ)するアルゴリズムの開発等を行った(このようなアルゴリズムが得られれば,クラスタリング的手法と本アルゴリズムを組み合わせることによりスキーマ抽出を行うことができる). 本研究では,XMLデータをラベル付き順序木とみなす.前年度,報告者は2個のXMLデータを併合するためのアルゴリズムを構成したが,このアルゴリズムでは併合の際に用いる操作が(1)頂点の追加,(2)頂点の削除,(3)頂点のラベルの変更,という3種のものに限定されていた(各操作にはコストが付与される).今年度は,これら3種の操作に加えて(4)部分木の移動,という操作を追加した上で,2個のXMLデータを併合する問題について考察した.本研究で得られた結果は次の通りである.まず,2個のXMLデータおよび操作系列が与えられた場合に,その操作系列をXMLデータに適用して併合を行う多項式時間アルゴリズムを構成した.次に,2個のXMLデータおよび整数Kに対して,それらXMLデータがコストK以下で併合可能か否かを決定する問題がNP完全であることを示した.最後に,「部分木の移動」のコストが移動対象の頂点にのみ依存し,かつ,操作系列に含まれる「部分木の移動」操作の数がある定数以下に抑えられている場合,併合を行うための操作系列でコスト最小のものが多項式時間で得られることを示した.

Report

(2 results)

2003 Annual Research Report
2002 Annual Research Report

Research Products
(4 results)

All Other

All Publications (4 results)

[Publications] Nobutaka Suzuki: "On Merging Structured Documents with Move Operation"Proceedings of the International Symposium on Information and Communication Technologies (ISICT03). 256-261 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Nobutaka Suzuki: "A Document Merging Method Supporting Move Operation"Technical Report of IEICE. COMP2003-67. 37-44 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Nobutaka Suzuki: "A Structural Merging Algorithm for XML Documents"Proceedings of IADIS International Conference WWW/Internet 2002. 699-703 (2002)
- Related Report
  2002 Annual Research Report
[Publications] Nobutaka Suzuki: "A Structural Merging Algorithm for Hierarchically Structured Documents"Technical Report of IEICE (COMP). COMP2002-32. 17-24 (2002)
- Related Report
  2002 Annual Research Report

半構造XMLデータからのスキーマ抽出及び変換アルゴリズムの開発

Principal Investigator

鈴木 伸崇 岡山県立大学, 情報工学部, 助手 (60305779)

¥3,100,000 (Direct Cost: ¥3,100,000)

Report

Research Products

[Publications] Nobutaka Suzuki: "On Merging Structured Documents with Move Operation"Proceedings of the International Symposium on Information and Communication Technologies (ISICT03). 256-261 (2003)

Related Report

[Publications] Nobutaka Suzuki: "A Document Merging Method Supporting Move Operation"Technical Report of IEICE. COMP2003-67. 37-44 (2003)

Related Report

[Publications] Nobutaka Suzuki: "A Structural Merging Algorithm for XML Documents"Proceedings of IADIS International Conference WWW/Internet 2002. 699-703 (2002)

Related Report

[Publications] Nobutaka Suzuki: "A Structural Merging Algorithm for Hierarchically Structured Documents"Technical Report of IEICE (COMP). COMP2002-32. 17-24 (2002)

Related Report

鈴木伸崇岡山県立大学, 情報工学部, 助手 (60305779)