• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

Webデータに対する情報検索における情報単位に関する研究

Research Project

Project/Area Number 22700248
Research InstitutionDoshisha University

Principal Investigator

波多野 賢治  同志社大学, 文化情報学部, 准教授 (80314532)

Project Period (FY) 2010-04-01 – 2013-03-31
Keywords情報検索 / 情報単位 / 可視化
Research Abstract

本研究では,多くの Web 検索エンジンが検索結果の表示形式として採用している「検索結果=Web 文書のリスト」という枠組みにとらわれず,Web データに対する情報検索における新しい検索結果の形式,すなわち情報単位を,Web 文書間のリンク構造,Web 文書内の文書構造,そして利用者が入力する情報要求から算出される索引語の重みにより決定する方法の提案を行った.
研究期間の一年目は手始めとして「検索結果=情報単位のリスト」という形式を追求するために,情報単位の重要度計算アルゴリズムの開発を,二年目はリスト形式による表示よって利用者が抱える問題の一つである検索結果の見通しの悪さを解決するための提示手法として,クエリとして入力された内容に合致する部分をハイライト表示する方法の提案を行い,それらの有用性を確認することができた.
最終年度である今年度は,実際にその手法を実際の Web 検索システムに実装し,実運用に耐えうるものかどうかの確認を行った.その結果,提案した情報単位表示方式は入力したクエリキーワードを基準に,Web テキスト上に着目すべき部分がハイライト表示されるため,どの文書のどの部分に利用者の情報要求を満たす部分が存在するのかを容易に判断できる有用なツールとなり得ることがわかったのと同時に,一般の Web 検索エンジン,つまり,格納されている Web 文書数が膨大なものに対しては,各索引語の重み計算,および新しい Web 文書の追加による索引語の重み再計算にコストがかかるという問題があることも判明した.しかしながら,このような提示形式を使用できるような場面,例えばある組織で公開されている Web 文書,すなわちその組織内 Web 文書の検索をするというドメイン内検索のような場面においては,非常に有効に機能することも判明し,本研究を行う意義は十分にあったと言える.

Current Status of Research Progress
Reason

24年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

24年度が最終年度であるため、記入しない。

  • Research Products

    (7 results)

All 2013 2012 Other

All Presentation (7 results)

  • [Presentation] A Report on the Size of Information Unit to Extract Contents on the Web text2013

    • Author(s)
      Saori Kitahara, and Kenji Hatano
    • Organizer
      International MultiConference of Engineers and Computer Scientists 2013 (IMECS 2013)
    • Place of Presentation
      China
    • Year and Date
      20130313-20130315
  • [Presentation] 更新を考慮したXML部分文書検索システムの精度の改善2013

    • Author(s)
      欅惇志,宮崎純,波多野賢治,山本豪志朗,武富貴史,加藤博一
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム (DEIM 2013)
    • Place of Presentation
      福島県郡山市
    • Year and Date
      20130303-20130305
  • [Presentation] Webページにおけるハイパリンクを考慮した内容抽出とその評価2013

    • Author(s)
      北原沙緒理, 波多野賢治
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム (DEIM 2013)
    • Place of Presentation
      福島県郡山市
    • Year and Date
      20130303-20130305
  • [Presentation] レファレンスデータを用いた情報探索過程段階化手法の検討2013

    • Author(s)
      嫁兼弘修,北原沙緒理, 波多野賢治
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム (DEIM 2013)
    • Place of Presentation
      福島県郡山市
    • Year and Date
      20130303-20130305
  • [Presentation] Fast and Incremental Indexing in Effective and Efficient XML Element Retrieval Systems2012

    • Author(s)
      Atsushi Keyaki, Jun Miyazaki, Kenji Hatano, Goshiro Yamamoto, Takafumi Taketomi, and Hirokazu Kato
    • Organizer
      14th International Conference on Information Integration and Web-based Applications & Services (iiWAS 2012)
    • Place of Presentation
      Indonesia
    • Year and Date
      20121203-20121205
  • [Presentation] XML部分文書検索における索引の高速な差分更新と高精度検索2012

    • Author(s)
      欅惇志, 宮崎純, 波多野賢治, 山本豪志朗, 武富貴史, 加藤博一
    • Organizer
      第5回Webとデータベースに関するフォーラム (WebDB Forum 2012)
    • Place of Presentation
      東京都千代田区
    • Year and Date
      20121120-20121121
  • [Presentation] 単語位置を考慮した単語単位で行うWebテキストの内容抽出に対する一考察

    • Author(s)
      北原沙緒理, 波多野賢治
    • Organizer
      平成24年度情報処理学会関西支部支部大会
    • Place of Presentation
      大阪市

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi