• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

Webデータに対する情報検索における情報単位に関する研究

Research Project

Project/Area Number 22700248
Research InstitutionDoshisha University

Principal Investigator

波多野 賢治  同志社大学, 文化情報学部, 准教授 (80314532)

Keywords検索エンジン / 情報単位 / 文書構造 / 文書間構造
Research Abstract

本年度の最初のステップは,構造化文書の文書構造および文書間に張られているリンクを意識した新しい検索単位である情報単位を抽出することである.申請者はこれまで検索システム利用者が入力する問合せに適合する部分文書を,構造化文書の文書構造から抽出する研究を続けているが,本年度はそうして抽出された部分文書に対し,リンクでつながっているという事実を用いて情報単位を同一文書内にとどまらず,複数文書間にまで拡張することを考えた.
これまで申請者が行ってきた研究では,構造化文書内の各ノードに含まれている索引語に対し,文書の論理構造を基にした統計量を利用した重み付けを行っていた.これに対し,本申請における提案では,そうして重み付けされた各ノードに対し,構造化文書間に張られているリンクを考慮してノード間に新たなエッジを付与し,文書ノード間を文書構造エッジとリンク構造エッジの二種類でネットワークを構成することで,ノードに重みが付与されたネットワークをネットワーク分析手法によって分析し,クリークを発見することで新しい検索単位である情報単位を抽出した.この手法により情報単位の抽出は可能となったが,予想通り,情報単位の抽出には多くの時間を要するという問題が生じた.そのため,並行して別のWeb文書情報単位抽出技術の提案も行った.この手法はWeb文書内の各ノードに含まれている索引語に対し,影響度というWeb文書内の出現位置を考慮した重みを与え,その重みの重なりを利用して情報単位を抽出する手法である.この手法も現時点では抽出に時間を要するが,その問題となっている点は既に計算複雑性理論の研究において効率的に解けることが判明しており,それを元に効率のよいWeb文書情報単位抽出技術を開発できる可能性がある点が優位であることがわかった.

  • Research Products

    (8 results)

All 2011 2010

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (6 results)

  • [Journal Article] 有益な検索結果提示のための部分文書再構成手法の提案2011

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Journal Title

      情報処理学会論文誌:データベース

      Volume: Vol.4, No.1 Pages: 1-13

    • Peer Reviewed
  • [Journal Article] A Query-oriented XML Fragment Search Approach on A Relational Database System2010

    • Author(s)
      A.Keyaki, K.Hatano, J.Miyazaki
    • Journal Title

      Journal of Digital Information Management

      Volume: Vol.8, No.3 Pages: 175-180

    • Peer Reviewed
  • [Presentation] Webテキストにおける内容密度分布の抽出とその評価2011

    • Author(s)
      北原沙緒理, 田村航弥, 波多野賢治
    • Organizer
      第3回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ラフォーレ修善寺(静岡県)
    • Year and Date
      2011-02-27
  • [Presentation] リンク情報に基づく周辺文書の索引語尤度を考慮した文書検索手法の提案と評価2011

    • Author(s)
      田村航弥, 波多野賢治, 宿久洋
    • Organizer
      第3回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ラフォーレ修善寺(静岡県)
    • Year and Date
      2011-02-27
  • [Presentation] A Result Reconstruction Method for Effective XML Fragment Search at INEX 20102010

    • Author(s)
      A.Keyaki, K.Hatano, J.Miyazaki
    • Organizer
      INEX 2010 Workshop
    • Place of Presentation
      House of Bergen, Vught
    • Year and Date
      2010-12-13
  • [Presentation] Result Reconstruction Approach for More Effective XML Fragment Search2010

    • Author(s)
      A.Keyaki, K.Hatano, J.Miyazaki
    • Organizer
      The 12th International Conference on Information Integration and Web-based Applications & Services
    • Place of Presentation
      IUFM University Cergy-Pontoise, Gennevilliers
    • Year and Date
      2010-11-09
  • [Presentation] 再構成されたXML部分文書に対するランキング手法の提案2010

    • Author(s)
      欅惇志, 波多野賢治, 宮崎純
    • Organizer
      電子情報通信学会WI2研究会 第18回Webインテリジェンスとインタラクション研究会
    • Place of Presentation
      国際佐渡観光ホテル八幡館(新潟県)
    • Year and Date
      2010-09-16
  • [Presentation] Characterizing Web Pages based on the Query Likelihoods of Neighboring Pages2010

    • Author(s)
      K.Tamura, K.Hatano, H.Yadohisa
    • Organizer
      The 5th International Conference on Digital Information Management
    • Place of Presentation
      Lakehead University, Ontario
    • Year and Date
      2010-07-07

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi