2001 Fiscal Year Annual Research Report
個別化異種XMLデータの管理と簡易検索に関する研究
Project/Area Number |
13224067
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
吉川 正俊 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736)
|
Co-Investigator(Kenkyū-buntansha) |
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
Keywords | XML / データ統合 / 利用者インタフェース / 時制データベース / 情報検索 |
Research Abstract |
論理構造が不定の多様なXMLデータを管理し,高度な検索機能を,.使い易い利用者インタフェースで提供するXMLデータベースに関する研究を行った. 1.XML文書の検索を高速化するための索引技法の開発 更新の頻度が高いXMLデータのために,更新に対して頑健なXMLデータ索引を開発した.XML文書木のノードを一意に識別する番号付与法であるUIDを用いることにより,二つのノードが先祖/子孫関係にあるか否かを判定可能である.しかし,UIDはXML文書の更新に対して脆弱である.そこで,UIDを拡張し,部分木の識別と部分木内のノードの識別のように階層化し,それを多段化することで得られる再帰的UIDを開発した. 2.XMLサーチエンジンのための検索手法の開発 XMLデータベースの末端利用者のために,データの類似度などの連続量の概念を持つ問合せモデルを導入し,XML用サーチエンジンの検索アルゴリズムの開発と実験を行った.膨大なXMLデータを対象として情報科学の非専門家が簡易検索を行なえるようなXMLサーチエンジンの検索アルゴリズムを開発した.利用者が問合せとしてキーワード集合を与えた場合,それに適合するXML文書の部分文書を検索する手法を開発した. 3.時制XMLデータの実装モデルの開発 時間情報の汎用的な記述の枠組みを表現するために十分な能力を持つ時制XMLデータモデルを開発した.開発中の時制XMLデータモデルを,transaction時間とvalid時間の両方を扱えるように拡張し,それを実際のXMLデータへ適用する際の最適な実装モデルを構築した.
|
Research Products
(3 results)
-
[Publications] Kenji Hatano: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"International Workshop on Data Semantics in Web Information Svstems (DASWIS-2001). 189-202 (2001)
-
[Publications] 絹谷 弘子: "XML文書の文書構造と内容を用いた部分文書の抽出手法"情報処理学会論文誌:データベース. (2002)
-
[Publications] Dao Dinh Kha: "A Structural Numbering Scheme fbr XML Data"Workshop on XML-Based Data Management (XMLDM). (2002)