• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

情報爆発時代の構造化文書の超高精度検索とその実現

Publicly Offered Research

Project AreaCyber Infrastructure for the Information-explosion Era
Project/Area Number 21013035
Research InstitutionNara Institute of Science and Technology

Principal Investigator

宮崎 純  Nara Institute of Science and Technology, 情報科学研究科, 准教授 (40293394)

Co-Investigator(Kenkyū-buntansha) 植村 俊亮  奈良産業大学, 情報学部, 教授 (00203480)
波多野 賢治  同志社大学, 文化情報学部, 准教授 (80314532)
Keywords情報抽出 / 情報システム / ディレクトリ・情報検索 / 構造化文書
Research Abstract

Web文書に代表される電子文書は近年急激に増加しており、その中から有用な情報を取得することが重要となってきている。特に文書のサイズが大きくなると、ユーザの情報要求に適合する箇所を文書中から発見することも困難となっている。
本研究では、電子文書の中でもXML文書に焦点を絞り、ユーザの情報要求に対して文書中で最も適合する一部分、すなわち部分文書の検索手法の高精度化について研究を行った。また、XML文書を処理するための問合せ言語XQueryの高性能化についても研究を行った。より具体的には、文書中における適合箇所と文書構造の関係を利用して、より良い検索結果を出力するための文書スコアリング方式を提案し評価を行った。また、複数の適合箇所が存在する場合には、それらを再構成してより適合度の高い検索結果を出力するための手法の提案を行った。前者に関しては、部分文書に含まれる検索キーワード数の割合を考慮し、従来の文書スコアリングと組み合わせることにより、検索精度が向上することが分かった。後者に関しては、隣接する複数の適合部分文書に関して、検索結果のサイズが大きくなり過ぎないように制限しつつ、同レベルの位置にある適合部分文書どうしは結合、包含関係にある適合部分文書はそれらを上位の部分文書に併合することにより、既存の手法と比較して40%以上の検索精度の改善ができることを明らかにした。さらに、文書サイズと検索結果となり得る部分文書の最大値の関係を実験的に明らかにした。

  • Research Products

    (9 results)

All 2010 2009

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (7 results)

  • [Journal Article] ロックフリーGCLOCKページ置換アルゴリズム2009

    • Author(s)
      油井誠, 宮崎純, 植村俊亮, 加藤博一, 山名早人
    • Journal Title

      情報処理学会論文誌データベース Vol.2, No.4

      Pages: 32-48

    • Peer Reviewed
  • [Journal Article] Utilizing Web Directories For Translation Disambiguation In Cross-Language Information Retrieval2009

    • Author(s)
      Fuminori Kimura, Akira Maeda, Kenji Hatano, Jun Miyazaki, Shunsuke Uemura
    • Journal Title

      Trends in Communication Technologies and Engineering Science Series (LNEE) Vol.33

      Pages: 95-107

    • Peer Reviewed
  • [Presentation] XML検索技術を利用した検索結果の構成手法2010

    • Author(s)
      棒惇志, 波多野賢治, 宮崎純
    • Organizer
      情報処理学会第72回全国大会
    • Place of Presentation
      東京
    • Year and Date
      2010-03-11
  • [Presentation] Nb-GCLOCK : A Non-blocking Buffer Management based on the Generalized CLOCK2010

    • Author(s)
      Makoto Yui, Jun Miyazaki, Shunsuke Uemura, Hayato Yamana
    • Organizer
      IEEE International Conference on Data Engineering (ICDE 2010)
    • Place of Presentation
      アメリカ・ロングビーチ
    • Year and Date
      2010-03-04
  • [Presentation] XML部分文書の再構成に基づく検索結果の提示手法2010

    • Author(s)
      棒惇志, 波多野賢治, 宮崎純
    • Organizer
      第2回データ工学と情報マネジメントに関するフォーラム(DEIM2010)
    • Place of Presentation
      淡路島
    • Year and Date
      2010-03-01
  • [Presentation] A Method of Generating Answer )ML Fragment from Ranked Results2009

    • Author(s)
      Atsushi Keyaki, Jun Miyazaki, Kenji Hatano
    • Organizer
      INEX 2009 Workshop
    • Place of Presentation
      オーストラリア・ブリズベン
    • Year and Date
      2009-12-07
  • [Presentation] 多用なコンテンツを活用するための高性能XMLデータ処理2009

    • Author(s)
      宮崎純
    • Organizer
      第2回ユニバーサルコミュニケーション研究会
    • Place of Presentation
      奈良
    • Year and Date
      2009-11-13
  • [Presentation] A Scoring Method of XML Fragments Considering Query-Oriented Statistics2009

    • Author(s)
      Atsushi Keyaki, Kenji Hatano, Jun Miyazaki
    • Organizer
      International Conference on the Applications of Digital Information and Web Technologies
    • Place of Presentation
      イギリス・ロンドン
    • Year and Date
      2009-08-05
  • [Presentation] 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果2009

    • Author(s)
      棒惇志, 波多野賢治, 宮崎純
    • Organizer
      情報処理学会データベースシステム研究会
    • Place of Presentation
      神戸
    • Year and Date
      2009-07-28

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi