• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

部分文書検索技術を利用した検索エンジンのスニペット構築に関する研究

研究課題

研究課題/領域番号 20700227
研究機関同志社大学

研究代表者

波多野 賢治  同志社大学, 文化情報学部, 准教授 (80314532)

キーワードXML情報検索 / KIWCインデックス / スニペット
研究概要

XML文書に対し利用者が問合せキーワードを入力し, そのキーワードに合致するXML部分文書を得る検索は¢XML情報検索」と呼ばれている. 検索対象が文書ではなくその部分文書となっていることで, 検索対象となる部分文書数が爆発的に増加するため, 検索精度の低下が問題となっているが, この技術を利用することで利用者が効率よく必要なデータにアクセスすることができるようになるという理由から, 「XML情報検索」は期待されている.
効率よく必要なデータにアクセスするためには, アクセスするためのKWICインデックスが必要である. 従来のKWICインデックスは1970年代に生まれた技術であり, 21世紀になった今もその基本は変化していない. そこで今年度はその基本技術にXML情報検索技術を適用するために, 文書構造を用いた索引語の重みづけを利用した改良型KWICインデックスを作成した. XML情報検索技術におけるインデックスは検索対象となるXML文書が木構造であるため, 従来型KWICインデックスとはデータ構造が異なるというミスマッチが生じていたが, データ構造の変更でこのミスマッチは解消できた. しかし, 肌情報検索技術で計算された索引語の重みをKWICインデックスに単純に適用しただけでは, 効率的なデータアクセスができる反面, その精度に問題が生じることが判明した. 次年度はこの問題点の解決を早急に行う予定である.

  • 研究成果

    (5件)

すべて 2009 2008

すべて 学会発表 (5件)

  • [学会発表] 語と語の関連性に基づくスコアリング手法の文書検索への応用利用とその評価2009

    • 著者名/発表者名
      伊藤ゆかり, 波多野賢治
    • 学会等名
      電子情報通信学会Webインテリジェンスとインタラクション研究会
    • 発表場所
      島根県松江市
    • 年月日
      2009-03-24
  • [学会発表] 文書内容の一貫性を考慮した検索手法の実装とその評価2009

    • 著者名/発表者名
      田村航弥, 波多野賢治
    • 学会等名
      電子情報通信学会Webインテリジェンスとインタラクション研究会
    • 発表場所
      島根県松江市
    • 年月日
      2009-03-24
  • [学会発表] 構造化文書の重要部分抽出のためのスコアリングアルゴリズム2009

    • 著者名/発表者名
      欅惇志, 波多野賢治, 宮崎純
    • 学会等名
      データ工学と情報マネジメントに関するフォーラム2009
    • 発表場所
      静岡県掛川市
    • 年月日
      2009-03-09
  • [学会発表] A Novel XML Fragment Retrieval Method based on Statistical Analyses2008

    • 著者名/発表者名
      K. Hatani, J. Miyazaki, and A. Keyaki
    • 学会等名
      INEX Workshop
    • 発表場所
      Schloss Dagstuhl, Germany
    • 年月日
      2008-12-16
  • [学会発表] クエリキーワードの位置情報を用いた構造化文書の重要部分抽出の一提案2008

    • 著者名/発表者名
      欅惇志, 波多野賢治
    • 学会等名
      情報処理学会関西支部支部大会
    • 発表場所
      京都市
    • 年月日
      2008-10-24

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi