• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

ブロックレベルWebページ検索の研究

Research Project

Project/Area Number 13J06384
Research InstitutionKyoto University

Principal Investigator

真鍋 知博  京都大学, 情報学研究科, 特別研究員(DC1)

Project Period (FY) 2013-04-01 – 2016-03-31
Keywords構造化文書 / 見出し抽出 / Web検索 / 近接検索 / サブトピック
Outline of Annual Research Achievements

本年度においては,大別して以下の二つの成果が得られた.
【1. 階層的見出し構造を考慮した近接検索】
検索に関し,意味単位間の関係を利用する既存手法として,近接検索が挙げられる.これは,語の出現の間の関係の強さを,その間の語数(距離)で測り,その出現を含む文書のスコアリングのために考慮するものである.これに対し本研究のアイデアは,語の出現の間にすでに特別な関係がある場合,その関係の強さは単純な距離ではなく距離の関数が反映するというものである.このアイデアに基づき本研究では,特別な関係として (1) 見出し中の出現とその対応するブロック中の出現という関係と,(2) 互いに異なるブロック中にある出現同士という関係に着目し,それぞれ関係の強さを距離の一次関数で測る手法を提案した.パラメータ最適化と評価によれば,提案手法は既存の近接検索手法をしのぐ性能を達成した.
【2. 階層的見出し構造に基づくサブトピックランキング】
キーワードクエリのサブトピックとは,元のクエリの意図を特化または明確化する意図をもつ別のクエリである.検索システムにとって,サブトピックは,クエリ補完・推薦の出力として有用であり,また複数の意図を同時に満たす検索結果を生成するためにも有用である.これらの応用のため,サブトピックを,ユーザがその意図をもつ確率(意図率)によってランキングすることが必要である.この問題を解くための本研究のアイデアは,Webページ中の階層的見出しはサブトピックに類似し,またブロックの記述量はその対応する階層的見出しが表すサブトピックの意図率を反映するというものである.このアイデアに基づき本研究では,あるサブトピックを,それを含む階層的見出しに対応する全てのブロックの記述量に基づき,ランキングする手法を提案した.評価によれば,提案手法は商用検索システムのクエリ補完・推薦をしのぐ性能を発揮した.

Research Progress Status

27年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

27年度が最終年度であるため、記入しない。

  • Research Products

    (6 results)

All 2016 2015 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results,  Acknowledgement Compliant: 2 results) Presentation (2 results) (of which Int'l Joint Research: 2 results) Remarks (2 results)

  • [Journal Article] Heading-Aware Proximity Measure and Its Application to Web Search2016

    • Author(s)
      Tomohiro Manabe and Keishi Tajima
    • Journal Title

      DBSJ Journal

      Volume: 14 Pages: 1-6

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Extracting Logical Hierarchical Structure of HTML Documents Based on Headings2015

    • Author(s)
      Tomohiro Manabe and Keishi Tajima
    • Journal Title

      Proceedings of the VLDB Endowment

      Volume: 8 Pages: 1606-1617

    • DOI

      10.14778/2824032.2824058

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] Subtopic Ranking Based on Hierarchical Headings2016

    • Author(s)
      Keishi Tajima
    • Organizer
      International Conference on Web Information Systems and Technologies
    • Place of Presentation
      Rome, Italy
    • Year and Date
      2016-04-23 – 2016-04-25
    • Int'l Joint Research
  • [Presentation] Heading-Aware Snippet Generation for Web Search2015

    • Author(s)
      Tomohiro Manabe
    • Organizer
      Asia Information Retrieval Societies Conference
    • Place of Presentation
      Brisbane, Australia
    • Year and Date
      2015-12-02 – 2015-12-04
    • Int'l Joint Research
  • [Remarks] Tanaka Laboratory

    • URL

      http://www.dl.kuis.kyoto-u.ac.jp/wordpress/en/

  • [Remarks] Tomohiro Manabe

    • URL

      http://tmanabe.github.io/

URL: 

Published: 2016-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi