• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ブロックレベルWebページ検索の研究

研究課題

研究課題/領域番号 13J06384
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
研究分野 メディア情報学・データベース
研究機関京都大学

研究代表者

真鍋 知博  京都大学, 情報学研究科, 特別研究員(DC1)

研究期間 (年度) 2013-04-01 – 2016-03-31
研究課題ステータス 完了 (2015年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2015年度: 1,100千円 (直接経費: 1,100千円)
2014年度: 1,100千円 (直接経費: 1,100千円)
2013年度: 1,100千円 (直接経費: 1,100千円)
キーワード構造化文書 / 見出し抽出 / Web検索 / 近接検索 / サブトピック / 半構造化文書 / 文書構造抽出 / テキストセグメンテーション / Web閲覧支援
研究実績の概要

本年度においては,大別して以下の二つの成果が得られた.
【1. 階層的見出し構造を考慮した近接検索】
検索に関し,意味単位間の関係を利用する既存手法として,近接検索が挙げられる.これは,語の出現の間の関係の強さを,その間の語数(距離)で測り,その出現を含む文書のスコアリングのために考慮するものである.これに対し本研究のアイデアは,語の出現の間にすでに特別な関係がある場合,その関係の強さは単純な距離ではなく距離の関数が反映するというものである.このアイデアに基づき本研究では,特別な関係として (1) 見出し中の出現とその対応するブロック中の出現という関係と,(2) 互いに異なるブロック中にある出現同士という関係に着目し,それぞれ関係の強さを距離の一次関数で測る手法を提案した.パラメータ最適化と評価によれば,提案手法は既存の近接検索手法をしのぐ性能を達成した.
【2. 階層的見出し構造に基づくサブトピックランキング】
キーワードクエリのサブトピックとは,元のクエリの意図を特化または明確化する意図をもつ別のクエリである.検索システムにとって,サブトピックは,クエリ補完・推薦の出力として有用であり,また複数の意図を同時に満たす検索結果を生成するためにも有用である.これらの応用のため,サブトピックを,ユーザがその意図をもつ確率(意図率)によってランキングすることが必要である.この問題を解くための本研究のアイデアは,Webページ中の階層的見出しはサブトピックに類似し,またブロックの記述量はその対応する階層的見出しが表すサブトピックの意図率を反映するというものである.このアイデアに基づき本研究では,あるサブトピックを,それを含む階層的見出しに対応する全てのブロックの記述量に基づき,ランキングする手法を提案した.評価によれば,提案手法は商用検索システムのクエリ補完・推薦をしのぐ性能を発揮した.

現在までの達成度 (段落)

27年度が最終年度であるため、記入しない。

今後の研究の推進方策

27年度が最終年度であるため、記入しない。

報告書

(3件)
  • 2015 実績報告書
  • 2014 実績報告書
  • 2013 実績報告書
  • 研究成果

    (11件)

すべて 2016 2015 2013 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件、 謝辞記載あり 2件) 学会発表 (3件) (うち国際学会 2件) 備考 (6件)

  • [雑誌論文] Heading-Aware Proximity Measure and Its Application to Web Search2016

    • 著者名/発表者名
      Tomohiro Manabe and Keishi Tajima
    • 雑誌名

      DBSJ Journal

      巻: 14 ページ: 1-6

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Extracting Logical Hierarchical Structure of HTML Documents Based on Headings2015

    • 著者名/発表者名
      Tomohiro Manabe, Keishi Tajima
    • 雑誌名

      Proceedings of VLDB

      巻: 8(12) 号: 12 ページ: 1606-1617

    • DOI

      10.14778/2824032.2824058

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] Subtopic Ranking Based on Hierarchical Headings2016

    • 著者名/発表者名
      Keishi Tajima
    • 学会等名
      International Conference on Web Information Systems and Technologies
    • 発表場所
      Rome, Italy
    • 年月日
      2016-04-23
    • 関連する報告書
      2015 実績報告書
    • 国際学会
  • [学会発表] Heading-Aware Snippet Generation for Web Search2015

    • 著者名/発表者名
      Tomohiro Manabe
    • 学会等名
      Asia Information Retrieval Societies Conference
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-12-02
    • 関連する報告書
      2015 実績報告書
    • 国際学会
  • [学会発表] Information Extraction based Approach for the NTCIR-10 1CLICK-2 Task2013

    • 著者名/発表者名
      Tomohiro Manabe, Kosetsu Tsukuda, Kazutoshi Umemoto, Yoshiyuki Shoji, Makoto P. Kato, Takehiro Yamamoto, Meng Zhao, Soungwoong Yoon, Hiroaki Ohshima and Katsumi Tanaka
    • 学会等名
      The 10th NTCIR Workshop Meeting on Evaluation of Information Access Technologies
    • 発表場所
      National Institute of Informatics, Tokyo, Japan
    • 年月日
      2013-06-21
    • 関連する報告書
      2013 実績報告書
  • [備考] Tanaka Laboratory

    • URL

      http://www.dl.kuis.kyoto-u.ac.jp/wordpress/en/

    • 関連する報告書
      2015 実績報告書
  • [備考] Tomohiro Manabe

    • URL

      http://tmanabe.github.io/

    • 関連する報告書
      2015 実績報告書
  • [備考] Tanaka Laboratory

    • URL

      http://www.dl.kuis.kyoto-u.ac.jp/

    • 関連する報告書
      2014 実績報告書
  • [備考] 真鍋 知博 (MANABE, Tomohiro)

    • URL

      http://www.dl.kuis.kyoto-u.ac.jp/~manabe/

    • 関連する報告書
      2014 実績報告書
  • [備考] TanakaLaboratory :

    • URL

      http://www.dl.kuis.kyoto-u.ac.jp/

    • 関連する報告書
      2013 実績報告書
  • [備考] 真鍋 知博 MANABE, Tomohiro :

    • URL

      http://ww.dl.kuis.kyoto-u.ac.jp/~manabe/

    • 関連する報告書
      2013 実績報告書

URL: 

公開日: 2014-01-29   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi