XMLで表現されるマルチメディアデータの効果的検索法に関する研究

研究課題

研究課題/領域番号	12780309
研究種目	奨励研究(A)
配分区分	補助金
研究分野	情報システム学(含情報図書館学)
研究機関	奈良先端科学技術大学院大学
研究代表者	波多野賢治奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
研究期間 (年度)	2000 – 2001
研究課題ステータス	完了 (2001年度)
配分額 *注記	1,900千円 (直接経費: 1,900千円) 2001年度: 900千円 (直接経費: 900千円) 2000年度: 1,000千円 (直接経費: 1,000千円)
キーワード	XML / 電子文書 / 情報検索 / 検索単位 / 評価値の統合手法 / 複数メディア / 検索手法の統合
研究概要	これまで提案されてきた文書検索は,文書全体を検索単位としてそれに含まれている文字列を特徴として扱っていた.しかし,近年,XML文書のような構造を持った文書やPDF, MPEG-7のような複数のメディアを扱った文書が多くなり,それに伴ってそれら文書を検索する際に従来の文書検索技術をそのまま適用することが難しいという問題が発生していた. 本研究では,従来の文書検索のように一つの文書から一つの特徴量を抽出するのではなく,文書からは複数のさまざまな特徴量が抽出できると考え,XML文書検索の場合は文書内容とその構造から,PDFやMPEG-7文書検索の場合はその文書に含まれるそれぞれのメディアのコンテンツから特徴量を抽出し,それらを最適な単位で検索する手法を提案した.具体的には,XML文書検索の場合,XML文書の特徴量を最も忠実に抽出できる単位が存在するので,その単位を文書構造から推定する手法を確立した.また同時に,抽出された単位と利用者の入力した問合せの類似度計算の手法を提案し,その計算手法をXML文書検索に適用することで10%程度の検索精度の向上した.さらに,PDF文書検索の場合は,抽出された複数のメディアの特徴量を等価に扱わなければ双方の特徴を利用した検索が実現できないため,それら特徴量の正規化手法の提案を行った.この手法が確立されたことで,昨年度提案した複数特徴量を統合した検索手法の検索精度が最大25%程度向上した.

報告書

(2件)

2001 実績報告書
2000 実績報告書

研究成果
(7件)

すべてその他

すべて文献書誌 (7件)

[文献書誌] 波多野賢治, 渡邉正裕他: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 40・SIG3(TOD10). 47-59 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 鈴木優, 波多野賢治他: "複数のメディアで構成された電子文書の検索手法"情報処理学会論文誌:データベース. 40・SIG10(TOD11). 11-21 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 絹谷弘子, 波多野賢治他: "XML文書の文書構造と内容を用いた部分文書の抽出手法"情報処理学会論文誌:データベース. (2002)
- 関連する報告書
  2001 実績報告書
[文献書誌] K.Hatano et al.: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"Proc.of the International Workshop on Data Semantics in Web Information Systems. 189-202 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] Y.Suzuki et al.: "Extraction and Integration of XML Document Features on Wireless Environment"Proc.of the First International Workshop on Wireless Information Systems. (2002)
- 関連する報告書
  2001 実績報告書
[文献書誌] Yu Suzuki,Kenji Hatano,Masatoshi Yoshikawa,Shunsuke Uemura: "A Unified Retrieval Method for Multimedia Documents"Proceedings of the 7^<th> International Conference on Database Systems For Advanced Databases (DASFAA'01). (2001)
- 関連する報告書
  2000 実績報告書
[文献書誌] Toshiyuki Amagasa,Minoru Nakai,Kenji Hatano,Masatoshi Yoshikawa,and Shunsuke Uemura: "Keyword Assignment to Images Using Sliding Windows"Proceedings of the 2000 ADBIS-DASFAA Symposium on Advances in Databases and Information Systems. 1-10 (2000)
- 関連する報告書
  2000 実績報告書

XMLで表現されるマルチメディアデータの効果的検索法に関する研究

研究代表者

波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)

1,900千円 (直接経費: 1,900千円)

報告書

研究成果

[文献書誌] 波多野 賢治, 渡邉 正裕 他: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 40・SIG3(TOD10). 47-59 (2001)

関連する報告書

[文献書誌] 鈴木 優, 波多野 賢治 他: "複数のメディアで構成された電子文書の検索手法"情報処理学会論文誌:データベース. 40・SIG10(TOD11). 11-21 (2001)

関連する報告書

[文献書誌] 絹谷 弘子, 波多野 賢治 他: "XML文書の文書構造と内容を用いた部分文書の抽出手法"情報処理学会論文誌:データベース. (2002)

関連する報告書

[文献書誌] K.Hatano et al.: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"Proc.of the International Workshop on Data Semantics in Web Information Systems. 189-202 (2001)

関連する報告書

[文献書誌] Y.Suzuki et al.: "Extraction and Integration of XML Document Features on Wireless Environment"Proc.of the First International Workshop on Wireless Information Systems. (2002)

関連する報告書

[文献書誌] Yu Suzuki,Kenji Hatano,Masatoshi Yoshikawa,Shunsuke Uemura: "A Unified Retrieval Method for Multimedia Documents"Proceedings of the 7^<th> International Conference on Database Systems For Advanced Databases (DASFAA'01). (2001)

関連する報告書

[文献書誌] Toshiyuki Amagasa,Minoru Nakai,Kenji Hatano,Masatoshi Yoshikawa,and Shunsuke Uemura: "Keyword Assignment to Images Using Sliding Windows"Proceedings of the 2000 ADBIS-DASFAA Symposium on Advances in Databases and Information Systems. 1-10 (2000)

関連する報告書

波多野賢治奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)

[文献書誌] 波多野賢治, 渡邉正裕他: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 40・SIG3(TOD10). 47-59 (2001)

[文献書誌] 鈴木優, 波多野賢治他: "複数のメディアで構成された電子文書の検索手法"情報処理学会論文誌:データベース. 40・SIG10(TOD11). 11-21 (2001)

[文献書誌] 絹谷弘子, 波多野賢治他: "XML文書の文書構造と内容を用いた部分文書の抽出手法"情報処理学会論文誌:データベース. (2002)