2007 年度実績報告書

検索の難しさの形式化と予測型検索方式に関する研究

研究課題

研究課題/領域番号	18650057
研究機関	神戸大学
研究代表者	江口浩二神戸大学, 大学院・工学研究科, 准教授 (50321576)
キーワード	情報検索 / クエリ構造化 / 語間依存性モデル / グラフィカルモデル / 確率的言語モデル
研究概要	今年度は、自然言語文における語間依存性を考慮した検索クエリ構築手法について検討した。日本語をはじめとするいくつかの東アジア言語の特徴の一つに、複合語が頻出することが挙げられる。また、自然言語文においては二語以上からなる言い回しがしばしば含まれる。これらは自然言語文による情報検索を難しくする要因の一つとなっている。そこで、まず、自然言語文に対してチャンク(かたまり)同定を行い、チャンクにおける構成語間の依存関係に着目した。さらに、チャンク間の依存関係に着目するが、組み合わせ爆発を回避するために、係り受け解析によって依存関係が認識された場合にのみ、そのチャンク間の依存関係を考慮した。このようにして、自然言語文におけるチャンク内の語間依存性と、チャンク間の依存性に着目する、クエリ構造化手法を設計した。これは平成18度に開発した二段階語間依存性モデルを、自然言語クエリを想定して拡張したものであり、従来手法のように語が互いに独立であるという非現実的な仮定によらず、マルコフランダム場モデルで表現される自然言語クエリの構成語の隣接関係のうち、自然言語解析を活用して、着目する依存関係を限定することで、計算量を軽減した効果的な構造化クエリ生成を実現するものである。JPドメインのウェブコンテンツからなるテストコレクションを利用して、有効性評価の予備実験を行った。

研究成果
(7件)

すべて 2008 2007

すべて雑誌論文 (5件) (うち査読あり 2件) 学会発表 (2件)

[雑誌論文] 確率的言語モデルによる意見文抽出のための局所文脈スムージング2008
- 著者名/発表者名
  本田徹也, 江口浩二
- 雑誌名
  
  情報処理学会研究報告 Vol.2008,No.33
  
  ページ: 83-90
[雑誌論文] Multi-Entity-Topic Models with Who-entities and Where-entities2007
- 著者名/発表者名
  Hitohiro Shiozaki, Koji Eguchi, and Takenao Ohkawa
- 雑誌名
  
  Proceedings of the International Workshop on Data-Mining and Statistical Science
  
  ページ: 165-178
- 査読あり
[雑誌論文] Opinion Retrieval Experiments using Generative Models: Experiments for the TREC 2007 Blog Track2007
- 著者名/発表者名
  Yuki Arai and Koji Eguchi
- 雑誌名
  
  Proceedings of the 16th Text Retrieval Conference (電子媒体)
[雑誌論文] Multitype Topic Models for Entity Ranking2007
- 著者名/発表者名
  Hitohiro Shiozaki and Koji Eguchi
- 雑誌名
  
  Pre-Proceedings of the 6th Workshop of the Initiative for the Evaluation of XML Retrieval
  
  ページ: 261-268
[雑誌論文] トピック依存型意見モデルを用いたブログに対する意見検索2007
- 著者名/発表者名
  新井勇輝, 江口浩二
- 雑誌名
  
  情報処理学会データベースとWeb情報システムに関するシンポジウム論文集 (電子媒体)
- 査読あり
[学会発表] トピック依存型意見検索モデルの開発とブログに対する評価2008
- 著者名/発表者名
  新井勇輝, 江口浩二
- 学会等名
  情報処理学会第70回全国大会
- 発表場所
  茨城県つくば市
- 年月日
  2008-03-15
[学会発表] Statistical Language Modeling for Opinion Retrieval2007
- 著者名/発表者名
  Koji Eguchi
- 学会等名
  The 3rd Korea-Japan Database Workshop
- 発表場所
  Pusan, South Korea
- 年月日
  2007-07-08

2007 年度 実績報告書

検索の難しさの形式化と予測型検索方式に関する研究

研究代表者

江口 浩二 神戸大学, 大学院・工学研究科, 准教授 (50321576)

研究成果

[雑誌論文] 確率的言語モデルによる意見文抽出のための局所文脈スムージング2008

著者名/発表者名

雑誌名

[雑誌論文] Multi-Entity-Topic Models with Who-entities and Where-entities2007

著者名/発表者名

雑誌名

[雑誌論文] Opinion Retrieval Experiments using Generative Models: Experiments for the TREC 2007 Blog Track2007

著者名/発表者名

雑誌名

[雑誌論文] Multitype Topic Models for Entity Ranking2007

著者名/発表者名

雑誌名

[雑誌論文] トピック依存型意見モデルを用いたブログに対する意見検索2007

著者名/発表者名

雑誌名

[学会発表] トピック依存型意見検索モデルの開発とブログに対する評価2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Statistical Language Modeling for Opinion Retrieval2007

著者名/発表者名

学会等名

発表場所

年月日

2007 年度実績報告書

江口浩二神戸大学, 大学院・工学研究科, 准教授 (50321576)