• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

検索の難しさの形式化と予測型検索方式に関する研究

研究課題

研究課題/領域番号 18650057
研究種目

萌芽研究

配分区分補助金
研究分野 情報図書館学・人文社会情報学
研究機関神戸大学

研究代表者

江口 浩二  神戸大学, 工学研究科, 准教授 (50321576)

研究期間 (年度) 2006 – 2008
研究課題ステータス 完了 (2008年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
2008年度: 700千円 (直接経費: 700千円)
2007年度: 700千円 (直接経費: 700千円)
2006年度: 800千円 (直接経費: 800千円)
キーワード情報検索 / クエリ構造化 / クエリ拡張 / 語間依存性モデル / マルコフ確率場モデル / 確率的言語モデル / 近接クエリ / グラフィカルモデル / マルコフランダム場モデル / 適合モデル
研究概要

日本語をはじめとするいくつかの東アジア言語の特徴の一つに複合語が頻出することが挙げられ、キーワードによる情報検索の精度を劣化させる原因の一つとなっている。また、自然言語文においては二語以上からなる言い回しがしばしば含まれ、自然言語文による情報検索を難しくする要因の一つとなっている。さらに、日本語に限らず一般に、情報検索の難しさの要因として、同義語や多義語の存在が挙げられる。これらの問題意識のもと、最終年度である平成20年度は、前年度までに検討してきた、(1)語間依存性と関連性を考慮した検索クエリ構築手法、および、(2)自然言語文における語間依存性を考慮した検索クエリ構築手法について、評価および成果の取りまとめを実施した。それぞれについて以下に概要を示す。
1.入力クエリを構成する個々の複合語における構成語間の依存関係、並びに、複合語間の依存関係に着目した二段階語間依存性モデルを開発した。これはマルコフ確率場モデルに基づき、入力クエリの構成語の隣接関係を利用して構造化クエリを自動生成する。さらに、二段階語間依存性モデルと適合モデルを組み合わせる方式について検討した。適合モデルは情報検索のための確率的言語モデルの枠組みによってクエリ拡張を実現する技法である。
2.自然言語文に対してチャンク(かたまり)同定を行い、チャンク内の語間依存性と、チャンク間の依存性に着目したクエリ構造化手法を設計した。これは上述の二段階語間依存性モデルを、自然言語文クエリを想定して拡張したものであり、係り受け解析の結果を活用して、着目する依存関係を限定することで、計効果的な構造化クエリ生成を実現するものである。
以上の提案手法について、JPドメインのウェブデータを利用して、有効性評価を行った。

報告書

(3件)
  • 2008 実績報告書
  • 2007 実績報告書
  • 2006 実績報告書
  • 研究成果

    (22件)

すべて 2009 2008 2007 2006 その他

すべて 雑誌論文 (14件) (うち査読あり 8件) 学会発表 (7件) 備考 (1件)

  • [雑誌論文] 多型トピックモデルを用いたアノテーション付き文書に対する検索手法2009

    • 著者名/発表者名
      江口浩二, 塩崎仁博
    • 雑誌名

      電子情報通信学会論文誌 Vol. J92-D, No. 3

      ページ: 311-320

    • NAID

      110007381171

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Entity Network Prediction using Multitype Topic Models2008

    • 著者名/発表者名
      Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
    • 雑誌名

      Advances in Knowledge Discovery and Data Mining : 12th Pacific-Asia Conference, PAKDD 2008 Vol. LNCS-5012

      ページ: 705-714

    • NAID

      10026806317

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Entity Ranking from Annotated Text Collections using Multitype Topic Models2008

    • 著者名/発表者名
      Hitohiro Shiozaki, Koji Eguchi
    • 雑誌名

      Focused Access to XML Documents : 6th International Workshop of the Inilialive for the Evaluation of XML Rclrieval, INEX2007 Vol. LNCS-4862

      ページ: 279-292

    • NAID

      110006834777

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Automatic Query Structuring from Sentences for Japanese Web Retrieval2008

    • 著者名/発表者名
      Tetsuya Shibata, Koji Eguchi
    • 雑誌名

      Proceedings of the 2nd ACM Workshop on Improving Non-English Web Searching なし

      ページ: 55-62

    • NAID

      110006834773

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Entity Network Prediction using Multitype Topic Models2008

    • 著者名/発表者名
      Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
    • 雑誌名

      IEICE Transactions on Information and Systems Vol. E91-D, No. 11

      ページ: 2589-2598

    • NAID

      10026806317

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Improving Document Representation for Story Link Detection by Modeling Term Topicality2008

    • 著者名/発表者名
      Chirac Shah, Koji Eguchi
    • 雑誌名

      IPSJ Transactions on Databases Vol. 1, No. 3

      ページ: 11-19

    • NAID

      130000107988

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] 確率的言語モデルによる意見文抽出のための局所文脈スムージング2008

    • 著者名/発表者名
      本田 徹也, 江口 浩二
    • 雑誌名

      情報処理学会研究報告 Vol.2008,No.33

      ページ: 83-90

    • NAID

      110006825048

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] Multi-Entity-Topic Models with Who-entities and Where-entities2007

    • 著者名/発表者名
      Hitohiro Shiozaki, Koji Eguchi, and Takenao Ohkawa
    • 雑誌名

      Proceedings of the International Workshop on Data-Mining and Statistical Science

      ページ: 165-178

    • NAID

      130008079502

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Opinion Retrieval Experiments using Generative Models: Experiments for the TREC 2007 Blog Track2007

    • 著者名/発表者名
      Yuki Arai and Koji Eguchi
    • 雑誌名

      Proceedings of the 16th Text Retrieval Conference (電子媒体)

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] Multitype Topic Models for Entity Ranking2007

    • 著者名/発表者名
      Hitohiro Shiozaki and Koji Eguchi
    • 雑誌名

      Pre-Proceedings of the 6th Workshop of the Initiative for the Evaluation of XML Retrieval

      ページ: 261-268

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] トピック依存型意見モデルを用いたブログに対する意見検索2007

    • 著者名/発表者名
      新井 勇輝, 江口 浩二
    • 雑誌名

      情報処理学会データベースとWeb情報システムに関するシンポジウム論文集 (電子媒体)

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Query Structuring with Two-stage Term Dependence in the Japanese Language2006

    • 著者名/発表者名
      Koji Eguchi, W. Bruce Croft
    • 雑誌名

      Information Retrieval Technology, Third Asia Information Retrieval Symposium, Singapore, Lecture Notes in Computer Science Vol.4182

      ページ: 522-529

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Boosting Relevance Model Performancewith Query Term Dependence2006

    • 著者名/発表者名
      Koji Eguchi, W. Bruce Croft
    • 雑誌名

      Proceedings of the 15th ACM Conference on Information and Knowledge Management (CIKM 2006), Arlington, Virginia, USA

      ページ: 792-793

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Opinion Retrieval Experiments using Generative Models : Experiments for the TREC 2006 Blog Track2006

    • 著者名/発表者名
      Koji Eguchi, Chirag Shah
    • 雑誌名

      Proceedings of the 15th Text REtrieval Conference (TREC 2006), Gaithersburg, Maryland, USA

    • 関連する報告書
      2006 実績報告書
  • [学会発表] 多重トピックを用いたブログ空間の情報伝搬解析2009

    • 著者名/発表者名
      横山正太朗, 江口浩二, 大川剛直
    • 学会等名
      情報処理学会第190回自然言語処理研究会
    • 発表場所
      東京都文京区
    • 年月日
      2009-03-26
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 多型トピックモデルを用いたWikipedia検索2009

    • 著者名/発表者名
      江口浩二, 塩崎仁博
    • 学会等名
      人工知能学会第20回セマンティックウェブとオントロジー研究会・ Wikipediaワークショップ
    • 発表場所
      東京都文京区
    • 年月日
      2009-01-22
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 情報コンテンツからの社会ネットワーク構造の抽出と活用2008

    • 著者名/発表者名
      江口浩二
    • 学会等名
      日本学術振興会光ネットワークシステム技術第171委員会第33回研究会
    • 発表場所
      兵庫県神戸市
    • 年月日
      2008-07-28
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索2008

    • 著者名/発表者名
      江口浩二, 塩崎仁博
    • 学会等名
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • 発表場所
      北海道小樽市
    • 年月日
      2008-06-20
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 自然言語文からの構造化クエリの自動生成によるWeb情報検索2008

    • 著者名/発表者名
      柴田鉄也, 江口浩二
    • 学会等名
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • 発表場所
      北海道小樽市
    • 年月日
      2008-06-19
    • 関連する報告書
      2008 実績報告書
  • [学会発表] トピック依存型意見検索モデルの開発とブログに対する評価2008

    • 著者名/発表者名
      新井 勇輝, 江口 浩二
    • 学会等名
      情報処理学会第70回全国大会
    • 発表場所
      茨城県つくば市
    • 年月日
      2008-03-15
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Statistical Language Modeling for Opinion Retrieval2007

    • 著者名/発表者名
      Koji Eguchi
    • 学会等名
      The 3rd Korea-Japan Database Workshop
    • 発表場所
      Pusan, South Korea
    • 年月日
      2007-07-08
    • 関連する報告書
      2007 実績報告書
  • [備考]

    • URL

      http://www.prmir.scitec.kobe-u.ac.jp/

    • 関連する報告書
      2008 実績報告書

URL: 

公開日: 2006-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi