研究分担者 |
加藤 弘之 国立情報学研究所, 情報学資源研究センター, 助手 (10321580)
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
渡邉 正裕 国立特殊教育総合研究所, 教育工学研究部, 研究員 (80321595)
|
研究概要 |
大量のXMLデータを効率良く管理,検索するとともに,複数のシステム間のXMLデータの交換を容易にする開放型高機能XMLサーチエンジンの要素技術を開発し,そのプロトタイプを実装した. 既存の構造化文書データベースの問合せモデルは,末端利用者の利用のためには機能レベルが低いため,文書ベクトルなど連続量の導入,名前空間を持つXML文書や整形式XML文書の検索のための論理構造の文脈の考慮,検索結果の変換機能などの点を補強する高機能問合せモデルを開発し,そのモデルに基づく実験検索システムを構築した. また,開発したモデルの問合せを高速に処理するためのXML索引を開発した. 末端利用者が与えたキーワード集合をもとに,適切なXML文書の部分文書を自動的に抽出するためのアルゴリズムとそれに基づくプロトタイプシステムの開発,および複数メディアから成る文書の検索を中心に研究を行った.具体的には,以下の成果を得た. 1.通常のHTMLサーチエンジンと同様に,少数のキーワード集合を入力するだけで,XML文書の構造情報と部分文書のベクトル情報をもとに,そのキーワード集合に合致する所望のXML部分文書を抽出するためのアルゴリズムを開発した. 2.関係データベースシステムにXML文書を格納する手法を拡張し,XML問合せ機能を高速に処理可能とするためのシステムを研究し,文書更新に効率的に対処可能な索引システム,文書の変更履歴を管理可能なデータモデルとそのシステムの開発を行った. 3.文字内容,図表内容,レイアウトに基づいてマルチメディア文書を検索するために,複数の特徴量を統合する手法を開発した.
|