• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

半構造XMLデータからのスキーマ抽出及び変換アルゴリズムの開発

研究課題

研究課題/領域番号 14780330
研究種目

若手研究(B)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関岡山県立大学

研究代表者

鈴木 伸崇  岡山県立大学, 情報工学部, 助手 (60305779)

研究期間 (年度) 2002 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
3,100千円 (直接経費: 3,100千円)
2003年度: 500千円 (直接経費: 500千円)
2002年度: 2,600千円 (直接経費: 2,600千円)
キーワードXML / データ変換 / スキーマ抽出 / アルゴリズム
研究概要

本研究のスキーマ抽出は,構造の類似したXMLデータ同士を同じクラスに分類し,同じクラスに属するデータを共通の構造に変換する,という手順で行われる.これを実現するため,本研究では構造の異なる2個のXMLデータを同じ構造に変換(この処理を以下では併合と呼ぶ)するアルゴリズムの開発等を行った(このようなアルゴリズムが得られれば,クラスタリング的手法と本アルゴリズムを組み合わせることによりスキーマ抽出を行うことができる).
本研究では,XMLデータをラベル付き順序木とみなす.前年度,報告者は2個のXMLデータを併合するためのアルゴリズムを構成したが,このアルゴリズムでは併合の際に用いる操作が(1)頂点の追加,(2)頂点の削除,(3)頂点のラベルの変更,という3種のものに限定されていた(各操作にはコストが付与される).今年度は,これら3種の操作に加えて(4)部分木の移動,という操作を追加した上で,2個のXMLデータを併合する問題について考察した.本研究で得られた結果は次の通りである.まず,2個のXMLデータおよび操作系列が与えられた場合に,その操作系列をXMLデータに適用して併合を行う多項式時間アルゴリズムを構成した.次に,2個のXMLデータおよび整数Kに対して,それらXMLデータがコストK以下で併合可能か否かを決定する問題がNP完全であることを示した.最後に,「部分木の移動」のコストが移動対象の頂点にのみ依存し,かつ,操作系列に含まれる「部分木の移動」操作の数がある定数以下に抑えられている場合,併合を行うための操作系列でコスト最小のものが多項式時間で得られることを示した.

報告書

(2件)
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] Nobutaka Suzuki: "On Merging Structured Documents with Move Operation"Proceedings of the International Symposium on Information and Communication Technologies (ISICT03). 256-261 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Nobutaka Suzuki: "A Document Merging Method Supporting Move Operation"Technical Report of IEICE. COMP2003-67. 37-44 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Nobutaka Suzuki: "A Structural Merging Algorithm for XML Documents"Proceedings of IADIS International Conference WWW/Internet 2002. 699-703 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Nobutaka Suzuki: "A Structural Merging Algorithm for Hierarchically Structured Documents"Technical Report of IEICE (COMP). COMP2002-32. 17-24 (2002)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi