• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

部分文書検索技術を利用した検索エンジンのスニペット構築に関する研究

Research Project

Project/Area Number 20700227
Research InstitutionDoshisha University

Principal Investigator

波多野 賢治  Doshisha University, 文化情報学部, 准教授 (80314532)

KeywordsXML情報検索 / KIWCインデックス / スニペット
Research Abstract

XML文書に対し利用者が問合せキーワードを入力し, そのキーワードに合致するXML部分文書を得る検索は¢XML情報検索」と呼ばれている. 検索対象が文書ではなくその部分文書となっていることで, 検索対象となる部分文書数が爆発的に増加するため, 検索精度の低下が問題となっているが, この技術を利用することで利用者が効率よく必要なデータにアクセスすることができるようになるという理由から, 「XML情報検索」は期待されている.
効率よく必要なデータにアクセスするためには, アクセスするためのKWICインデックスが必要である. 従来のKWICインデックスは1970年代に生まれた技術であり, 21世紀になった今もその基本は変化していない. そこで今年度はその基本技術にXML情報検索技術を適用するために, 文書構造を用いた索引語の重みづけを利用した改良型KWICインデックスを作成した. XML情報検索技術におけるインデックスは検索対象となるXML文書が木構造であるため, 従来型KWICインデックスとはデータ構造が異なるというミスマッチが生じていたが, データ構造の変更でこのミスマッチは解消できた. しかし, 肌情報検索技術で計算された索引語の重みをKWICインデックスに単純に適用しただけでは, 効率的なデータアクセスができる反面, その精度に問題が生じることが判明した. 次年度はこの問題点の解決を早急に行う予定である.

  • Research Products

    (5 results)

All 2009 2008

All Presentation (5 results)

  • [Presentation] 語と語の関連性に基づくスコアリング手法の文書検索への応用利用とその評価2009

    • Author(s)
      伊藤ゆかり, 波多野賢治
    • Organizer
      電子情報通信学会Webインテリジェンスとインタラクション研究会
    • Place of Presentation
      島根県松江市
    • Year and Date
      2009-03-24
  • [Presentation] 文書内容の一貫性を考慮した検索手法の実装とその評価2009

    • Author(s)
      田村航弥, 波多野賢治
    • Organizer
      電子情報通信学会Webインテリジェンスとインタラクション研究会
    • Place of Presentation
      島根県松江市
    • Year and Date
      2009-03-24
  • [Presentation] 構造化文書の重要部分抽出のためのスコアリングアルゴリズム2009

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Organizer
      データ工学と情報マネジメントに関するフォーラム2009
    • Place of Presentation
      静岡県掛川市
    • Year and Date
      2009-03-09
  • [Presentation] A Novel XML Fragment Retrieval Method based on Statistical Analyses2008

    • Author(s)
      K. Hatani, J. Miyazaki, and A. Keyaki
    • Organizer
      INEX Workshop
    • Place of Presentation
      Schloss Dagstuhl, Germany
    • Year and Date
      2008-12-16
  • [Presentation] クエリキーワードの位置情報を用いた構造化文書の重要部分抽出の一提案2008

    • Author(s)
      欅惇志, 波多野賢治
    • Organizer
      情報処理学会関西支部支部大会
    • Place of Presentation
      京都市
    • Year and Date
      2008-10-24

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi