2001 Fiscal Year Annual Research Report
Project/Area Number |
12680417
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
吉川 正俊 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 弘之 国立情報学研究所, 情報学資源研究センター, 助手 (10321580)
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
渡邉 正裕 国立特殊教育総合研究所, 教育工学研究部, 研究員 (80321595)
|
Keywords | XML / サーチエンジン / 利用者インターフェース / XML索引 / マルチメディア文書 |
Research Abstract |
大量のXMLデータを効率良く管理,検索するとともに,複数のシステム間のXMLデータの交換を容易にする開放型高機能XMLサーチエンジンの要素技術を開発し,そのプロトタイプを実装した. 既存の構造化文書データベースの問合せモデルは,末端利用者の利用のためには機能レベルが低いため,文書ベクトルなど連続量の導入,名前空間を持つXML文書や整形式XML文書の検索のための論理構造の文脈の考慮,検索結果の変換機能などの点を補強する高機能問合せモデルを開発し,そのモデルに基づく実験検索システムを構築した. また,開発したモデルの問合せを高速に処理するためのXML索引を開発した. 末端利用者が与えたキーワード集合をもとに,適切なXML文書の部分文書を自動的に抽出するためのアルゴリズムとそれに基づくプロトタイプシステムの開発,および複数メディアから成る文書の検索を中心に研究を行った.具体的には,以下の成果を得た. 1.通常のHTMLサーチエンジンと同様に,少数のキーワード集合を入力するだけで,XML文書の構造情報と部分文書のベクトル情報をもとに,そのキーワード集合に合致する所望のXML部分文書を抽出するためのアルゴリズムを開発した. 2.関係データベースシステムにXML文書を格納する手法を拡張し,XML問合せ機能を高速に処理可能とするためのシステムを研究し,文書更新に効率的に対処可能な索引システム,文書の変更履歴を管理可能なデータモデルとそのシステムの開発を行った. 3.文字内容,図表内容,レイアウトに基づいてマルチメディア文書を検索するために,複数の特徴量を統合する手法を開発した.
|
Research Products
(6 results)
-
[Publications] Dao Dinh Kha: "An XML Indexing Structure with Relative Region Coordinate"Proc.of the 17th IEEE International Conference on Data Engineering(ICDE2001). 313-320 (2001)
-
[Publications] Toshiyuki Amagasa: "Realizing Temporal XML Repositories using Temporal Relational Databases"The Third International Symposium on Cooperative Database Systems for Advanced Application(CODAS'2001). 63-67 (2001)
-
[Publications] 波多野 賢治: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 42・TOD10. 36-46 (2001)
-
[Publications] Masatoshi Yoshikawa: "XRel : A Path-Based Approach to Storage and Retrieval of XML Documents using Relational Databases"ACM Transactions on Internet Technology. 1・1. 110-141 (2001)
-
[Publications] 鈴木 優: "複数のメディアで構成された電子文書の検索手法"情報処理学会論文誌:データベース. 42・TOD11. 11-21 (2001)
-
[Publications] Yu Suzuki: "Content-based Retrieval Method for Multimedia Documents Using Text, Image and Layout Feature"The 14th International Conference on Advanced Information Systems Engineering(CAiSE'02). (2002)