• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

部分文書検索技術を利用した検索エンジンのスニペット構築に関する研究

Research Project

Project/Area Number 20700227
Research InstitutionDoshisha University

Principal Investigator

波多野 賢治  Doshisha University, 文化情報学部, 准教授 (80314532)

KeywordsXML情報検索 / 粒度再構成 / INEX
Research Abstract

XML文書に対し利用者が問合せキーワードを入力し,そのキーワードに合致するXML部分文書を得る検索は「XML情報検索」と呼ばれている.検索対象が文書ではなくその部分文書となっていることで,検索対象となる部分文書数が爆発的に増加するため,一般的に検索精度の低下が問題となる.しかし,この技術を利用することで利用者が効率よくまた効果的に必要なデータにアクセスすることができるようになるという理由から,「XML情報検索」に関する技術は一般ユーザから期待されている.
効果的に必要なデータにアクセスするためにはインデックスが必要となるが,このインデックスをXMLからどのように生成するのかについては,長年議論されてきた.現在,「XML情報検索」で用いられている検索モデルはBM25EもしくはLanguage Modelをベースにしたものが多いが,これらは検索対象となるXML文書群から抽出できる,索引語の数,XPathの数といった単純統計量が多い.しかしながら,前年度判明した問題点の考察から,今年度は単純な統計情報でカバーできない要件として,1)部分文書構成のための最適テキスト要素サイズ'および2)部分文書構成のための結合力,を定義し,これらの要件を満たすXML部分文書を再構成し,検索結果とした場合,従来の単純統計量を利用した手法に比べ46%もの精度向上を図ることができた(INEX test collection使用時).これにより,一般ユーザはさらに効果的に必要データにアクセスできるようになった.

  • Research Products

    (6 results)

All 2010 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results)

  • [Journal Article] A Query-oriented XML Fragment Search Approach on A Relational Database2010

    • Author(s)
      A.Keyaki, K.Hatano, J.Miyazaki
    • Journal Title

      Journal of Digital Information Management Vol.8, No.3

      Pages: 175-180

    • Peer Reviewed
  • [Presentation] XML検索技術を利用した検索結果の構成手法2010

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Organizer
      情報処理学会第72回全国大会
    • Place of Presentation
      東京大学
    • Year and Date
      2010-03-11
  • [Presentation] XML部分文書の再構成に基づく検索結果の提示手法2010

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Organizer
      第2回データ工学と情報マネージメントに関するフォーラム
    • Place of Presentation
      淡路夢舞台国際会議場
    • Year and Date
      2010-03-01
  • [Presentation] A Method of Generating Answer XML Fragment from Ranked Results2009

    • Author(s)
      欅惇志, 宮崎純, 波多野賢治
    • Organizer
      INEX2009 Workshop
    • Place of Presentation
      Woodlands of Marburg
    • Year and Date
      2009-12-07
  • [Presentation] A Scoring Method of XML Fragments Considering Query-Oriented Statistics2009

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Organizer
      Proc.of the 2nd International Conference on the Applications of Digital Information and Web Technologies(ICADIWT 2009)
    • Place of Presentation
      London Metropolitan University
    • Year and Date
      2009-08-05
  • [Presentation] 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果2009

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Organizer
      情報処理学会第148回データベースシステム研究会・第95回情報学基礎研究会合同研究会
    • Place of Presentation
      神戸ファッションマート
    • Year and Date
      2009-07-28

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi