• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

検索の難しさの形式化と予測型検索方式に関する研究

Research Project

Project/Area Number 18650057
Research Category

Grant-in-Aid for Exploratory Research

Allocation TypeSingle-year Grants
Research Field 情報図書館学・人文社会情報学
Research InstitutionKobe University

Principal Investigator

江口 浩二  Kobe University, 工学研究科, 准教授 (50321576)

Project Period (FY) 2006 – 2008
Project Status Completed (Fiscal Year 2008)
Budget Amount *help
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2008: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2007: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2006: ¥800,000 (Direct Cost: ¥800,000)
Keywords情報検索 / クエリ構造化 / クエリ拡張 / 語間依存性モデル / マルコフ確率場モデル / 確率的言語モデル / 近接クエリ / グラフィカルモデル / マルコフランダム場モデル / 適合モデル
Research Abstract

日本語をはじめとするいくつかの東アジア言語の特徴の一つに複合語が頻出することが挙げられ、キーワードによる情報検索の精度を劣化させる原因の一つとなっている。また、自然言語文においては二語以上からなる言い回しがしばしば含まれ、自然言語文による情報検索を難しくする要因の一つとなっている。さらに、日本語に限らず一般に、情報検索の難しさの要因として、同義語や多義語の存在が挙げられる。これらの問題意識のもと、最終年度である平成20年度は、前年度までに検討してきた、(1)語間依存性と関連性を考慮した検索クエリ構築手法、および、(2)自然言語文における語間依存性を考慮した検索クエリ構築手法について、評価および成果の取りまとめを実施した。それぞれについて以下に概要を示す。
1.入力クエリを構成する個々の複合語における構成語間の依存関係、並びに、複合語間の依存関係に着目した二段階語間依存性モデルを開発した。これはマルコフ確率場モデルに基づき、入力クエリの構成語の隣接関係を利用して構造化クエリを自動生成する。さらに、二段階語間依存性モデルと適合モデルを組み合わせる方式について検討した。適合モデルは情報検索のための確率的言語モデルの枠組みによってクエリ拡張を実現する技法である。
2.自然言語文に対してチャンク(かたまり)同定を行い、チャンク内の語間依存性と、チャンク間の依存性に着目したクエリ構造化手法を設計した。これは上述の二段階語間依存性モデルを、自然言語文クエリを想定して拡張したものであり、係り受け解析の結果を活用して、着目する依存関係を限定することで、計効果的な構造化クエリ生成を実現するものである。
以上の提案手法について、JPドメインのウェブデータを利用して、有効性評価を行った。

Report

(3 results)
  • 2008 Annual Research Report
  • 2007 Annual Research Report
  • 2006 Annual Research Report
  • Research Products

    (22 results)

All 2009 2008 2007 2006 Other

All Journal Article (14 results) (of which Peer Reviewed: 8 results) Presentation (7 results) Remarks (1 results)

  • [Journal Article] 多型トピックモデルを用いたアノテーション付き文書に対する検索手法2009

    • Author(s)
      江口浩二, 塩崎仁博
    • Journal Title

      電子情報通信学会論文誌 Vol. J92-D, No. 3

      Pages: 311-320

    • NAID

      110007381171

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Entity Network Prediction using Multitype Topic Models2008

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
    • Journal Title

      Advances in Knowledge Discovery and Data Mining : 12th Pacific-Asia Conference, PAKDD 2008 Vol. LNCS-5012

      Pages: 705-714

    • NAID

      10026806317

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Entity Ranking from Annotated Text Collections using Multitype Topic Models2008

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi
    • Journal Title

      Focused Access to XML Documents : 6th International Workshop of the Inilialive for the Evaluation of XML Rclrieval, INEX2007 Vol. LNCS-4862

      Pages: 279-292

    • NAID

      110006834777

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Automatic Query Structuring from Sentences for Japanese Web Retrieval2008

    • Author(s)
      Tetsuya Shibata, Koji Eguchi
    • Journal Title

      Proceedings of the 2nd ACM Workshop on Improving Non-English Web Searching なし

      Pages: 55-62

    • NAID

      110006834773

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Entity Network Prediction using Multitype Topic Models2008

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
    • Journal Title

      IEICE Transactions on Information and Systems Vol. E91-D, No. 11

      Pages: 2589-2598

    • NAID

      10026806317

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Improving Document Representation for Story Link Detection by Modeling Term Topicality2008

    • Author(s)
      Chirac Shah, Koji Eguchi
    • Journal Title

      IPSJ Transactions on Databases Vol. 1, No. 3

      Pages: 11-19

    • NAID

      130000107988

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 確率的言語モデルによる意見文抽出のための局所文脈スムージング2008

    • Author(s)
      本田 徹也, 江口 浩二
    • Journal Title

      情報処理学会研究報告 Vol.2008,No.33

      Pages: 83-90

    • NAID

      110006825048

    • Related Report
      2007 Annual Research Report
  • [Journal Article] Multi-Entity-Topic Models with Who-entities and Where-entities2007

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi, and Takenao Ohkawa
    • Journal Title

      Proceedings of the International Workshop on Data-Mining and Statistical Science

      Pages: 165-178

    • NAID

      130008079502

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Opinion Retrieval Experiments using Generative Models: Experiments for the TREC 2007 Blog Track2007

    • Author(s)
      Yuki Arai and Koji Eguchi
    • Journal Title

      Proceedings of the 16th Text Retrieval Conference (電子媒体)

    • Related Report
      2007 Annual Research Report
  • [Journal Article] Multitype Topic Models for Entity Ranking2007

    • Author(s)
      Hitohiro Shiozaki and Koji Eguchi
    • Journal Title

      Pre-Proceedings of the 6th Workshop of the Initiative for the Evaluation of XML Retrieval

      Pages: 261-268

    • Related Report
      2007 Annual Research Report
  • [Journal Article] トピック依存型意見モデルを用いたブログに対する意見検索2007

    • Author(s)
      新井 勇輝, 江口 浩二
    • Journal Title

      情報処理学会データベースとWeb情報システムに関するシンポジウム論文集 (電子媒体)

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Query Structuring with Two-stage Term Dependence in the Japanese Language2006

    • Author(s)
      Koji Eguchi, W. Bruce Croft
    • Journal Title

      Information Retrieval Technology, Third Asia Information Retrieval Symposium, Singapore, Lecture Notes in Computer Science Vol.4182

      Pages: 522-529

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Boosting Relevance Model Performancewith Query Term Dependence2006

    • Author(s)
      Koji Eguchi, W. Bruce Croft
    • Journal Title

      Proceedings of the 15th ACM Conference on Information and Knowledge Management (CIKM 2006), Arlington, Virginia, USA

      Pages: 792-793

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Opinion Retrieval Experiments using Generative Models : Experiments for the TREC 2006 Blog Track2006

    • Author(s)
      Koji Eguchi, Chirag Shah
    • Journal Title

      Proceedings of the 15th Text REtrieval Conference (TREC 2006), Gaithersburg, Maryland, USA

    • Related Report
      2006 Annual Research Report
  • [Presentation] 多重トピックを用いたブログ空間の情報伝搬解析2009

    • Author(s)
      横山正太朗, 江口浩二, 大川剛直
    • Organizer
      情報処理学会第190回自然言語処理研究会
    • Place of Presentation
      東京都文京区
    • Year and Date
      2009-03-26
    • Related Report
      2008 Annual Research Report
  • [Presentation] 多型トピックモデルを用いたWikipedia検索2009

    • Author(s)
      江口浩二, 塩崎仁博
    • Organizer
      人工知能学会第20回セマンティックウェブとオントロジー研究会・ Wikipediaワークショップ
    • Place of Presentation
      東京都文京区
    • Year and Date
      2009-01-22
    • Related Report
      2008 Annual Research Report
  • [Presentation] 情報コンテンツからの社会ネットワーク構造の抽出と活用2008

    • Author(s)
      江口浩二
    • Organizer
      日本学術振興会光ネットワークシステム技術第171委員会第33回研究会
    • Place of Presentation
      兵庫県神戸市
    • Year and Date
      2008-07-28
    • Related Report
      2008 Annual Research Report
  • [Presentation] 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索2008

    • Author(s)
      江口浩二, 塩崎仁博
    • Organizer
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • Place of Presentation
      北海道小樽市
    • Year and Date
      2008-06-20
    • Related Report
      2008 Annual Research Report
  • [Presentation] 自然言語文からの構造化クエリの自動生成によるWeb情報検索2008

    • Author(s)
      柴田鉄也, 江口浩二
    • Organizer
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • Place of Presentation
      北海道小樽市
    • Year and Date
      2008-06-19
    • Related Report
      2008 Annual Research Report
  • [Presentation] トピック依存型意見検索モデルの開発とブログに対する評価2008

    • Author(s)
      新井 勇輝, 江口 浩二
    • Organizer
      情報処理学会第70回全国大会
    • Place of Presentation
      茨城県つくば市
    • Year and Date
      2008-03-15
    • Related Report
      2007 Annual Research Report
  • [Presentation] Statistical Language Modeling for Opinion Retrieval2007

    • Author(s)
      Koji Eguchi
    • Organizer
      The 3rd Korea-Japan Database Workshop
    • Place of Presentation
      Pusan, South Korea
    • Year and Date
      2007-07-08
    • Related Report
      2007 Annual Research Report
  • [Remarks]

    • URL

      http://www.prmir.scitec.kobe-u.ac.jp/

    • Related Report
      2008 Annual Research Report

URL: 

Published: 2006-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi