経験マイニング技術の高度化と実用化

公募研究

研究領域	情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号	21013036
研究種目	特定領域研究
配分区分	補助金
審査区分	理工系
研究機関	東北大学 (2010) 奈良先端科学技術大学院大学 (2009)
研究代表者	乾健太郎東北大学, 大学院・情報科学研究科, 教授 (60272689)
研究分担者	渡邉陽太郎東北大学, 大学院・情報科学研究科, 助教 (70583326) 阿部修也奈良先端科学技術大学院大学, 情報科学研究科, 研究員 (70511179)
研究期間 (年度)	2009 – 2010
研究課題ステータス	完了 (2010年度)
配分額 *注記	4,900千円 (直接経費: 4,900千円) 2010年度: 2,400千円 (直接経費: 2,400千円) 2009年度: 2,500千円 (直接経費: 2,500千円)
キーワード	テキストマイニング / ブログ / 経験 / 自然言語処理 / 意味解析 / 情報抽出 / 事実性解析 / 評価極性
研究概要	ウェブには、社会的な大事件から個人の小さな経験まで、あるいは専門家の評論から一般ユーザの意見まで、さまざまな事実や意見の膨大な情報が日々刻々蓄積されている。こうした情報の山は、使い方によっては人類共通の「知の宝庫」となる可能性を秘めている。本研究では、ウェブ文書中に言葉で書かれた事実情報や意見情報をその意味内容に基づいて整理する言語情報編集技術の開発に取り組んだ。事実や意見の情報を整理する方法には、個々の情報をさまざまな観点から分類し、大きな表のような構造をつくる方法と、個々の情報の間の関係をとらえ、ネットワーク型の構造をつくる方法が考えられる。分類によって整理する方法については、ウェブ文書に書かれた個人の経験情報を<トピック,経験主,事態タイプ,事実性>という一般性の高い4種類の意味的な軸で分類し、巨大な経験データベースを自動生成する経験マイニング技術を世界で初めて開発した。「視力が戻る(=ポジティブな出来事)」のような幅広い事態表現を分類し、さらに事態の成立、不成立、願望などの事実性を区別して経験情報を収集する。これにより、たとえば「あるサービスの利用に伴うトラブル」や「ある商品に関心を持ちながらまだ買っていない人」など、複雑な検索も可能になる。一方、関係によって整理する方法については、別々の文書に書かれた情報の間の隠れた根拠関係を自動的に検出する技術を開発した。前述の経験マイニング技術を発展させるとともに、情報検索基盤「TSUBAKI」や大規模知識ベース「鳥式」など、本特定領域の成果を融合することで実現した。「ブルーベリーは視力回復に効果がある?」のような質問に対し、それを支持する根拠と否定する根拠をそれぞれウェブから探し出して提示する。

報告書

(2件)

2010 実績報告書
2009 実績報告書

研究成果
(26件)

すべて 2011 2010 2009

すべて雑誌論文 (16件) (うち査読あり 16件) 学会発表 (10件)

[雑誌論文] Mining Personal Experiences and Opinions from Web Documents2011
- 著者名/発表者名
  Shuya Abe, Kentaro Inui, Kazuo Hara, Hiraku Morita, Chitose Sao, Megumi Eguchi, Asuka Sumita, Koji Murakami, Suguru Matsuyoshi
- 雑誌名
  
  Web Intelligence and Agent Systems : An International Journal
  
  巻: 9-2(in press)
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Recognizing Confinement in Web Texts2011
- 著者名/発表者名
  Megumi Ohki, Eric Nichols, Suguru Matsuyoshi, Koji Murakami, Junta Mizuno, Shouko Masuda, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the 9th International Conference on Computational Semantics (IWCS 2011)
  
  ページ: 215-224
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Dependency Syntax Analysis Using Grammar Induction and a Lexical Categories Precedence System2011
- 著者名/発表者名
  Hiram Calvo, Omar J.Gambino, Alexander Gelbukh, Kentaro Inui
- 雑誌名
  
  Proceedings of the 12th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing)
  
  ページ: 109-120
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Co-related Verb Argument Selectional Preferences2011
- 著者名/発表者名
  Hiram Calvo, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the 12th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing)
  
  ページ: 133-143
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Resolving Direct and Indirect Anaphora for Japanese Definite Noun Phrases2010
- 著者名/発表者名
  Naoya Inoue, Ryu Iida, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Journal of Natural Language Processing
  
  巻: 17-1 ページ: 141-160
- NAID
  10027016150
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] 述語項構造と照応関係のアノテーション:NAISTテキストコーパス構築の経験から2010
- 著者名/発表者名
  飯田龍, 小町守, 乾健太郎, 松本裕治
- 雑誌名
  
  自然言語処理
  
  巻: 17-2 ページ: 25-50
- NAID
  10027016216
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] テキスト情報分析のための判断情報アノテーション2010
- 著者名/発表者名
  松吉俊, 江口萌, 佐尾ちとせ, 村上浩司, 乾健太郎, 松本裕治
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: J93-D ページ: 705-713
- NAID
  110007618345
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Annotating event mentions in text with modality, focus, and source information2010
- 著者名/発表者名
  Suguru Matsuyoshi, Megumi Eguchi, Chitose Sao, Koji Murakami, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC)
  
  ページ: 1456-1463
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] A Structured Model for Joint Learning of Argument Roles and Predicate Senses2010
- 著者名/発表者名
  Yotaro Watanabe, Masayuki Asahara, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the ACL 2010 Conference Short Papers
  
  ページ: 98-102
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Automatic Classification of Semantic Relations between Facts and Opinions2010
- 著者名/発表者名
  Koji Murakami, Eric Nichols, Junta Mizuno, Yotaro Watanabe, Hayato Goto, Megumi Ohki, Suguru Matsuyoshi, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the Second International Workshop on NLP Challenges in the Information Explosion Era (NLPIX 2010)
  
  ページ: 21-30
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Statement Map : Reducing Web Information Credibility Noise through Opinion Classification2010
- 著者名/発表者名
  Koji Murakami, Eric Nichols, Junta Mizuno, Yotaro Watanabe, Shouko Masuda, Hayato Goto, Megumi Ohki, Chitose Sao, Suguru Matsuyoshi, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the Fourth Workshop on Analytics for Noisy Unstructured Text Data (AND 2010)
  
  ページ: 59-66
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] 項の共有関係と統語パターンを用いた事態間関係獲得2010
- 著者名/発表者名
  阿部修也, 乾健太郎, 松本裕治
- 雑誌名
  
  自然言語処理 17(1)
- NAID
  10027016027
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] Resolving Direct and Indirect Anaphora for Japanese Definite Noun Phrases2010
- 著者名/発表者名
  Naoya Inoue, Ryu Iida, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Journal of Natural Language Processing 17(1)
- NAID
  10027016150
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] 共起パターンの学習による事態間関係知識の獲得2009
- 著者名/発表者名
  阿部修也, 乾健太郎, 松本裕治
- 雑誌名
  
  自然言語処理 16(4)
  
  ページ: 79-100
- NAID
  10025525159
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] Capturing Salience with a Trainable Cache Model for Zero-anaphora Resolution2009
- 著者名/発表者名
  Ryu Iida, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the JointConference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4th International Joint Conference on Natural Language Processing (ACL-IJCNLP)
  
  ページ: 647-655
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] Resolving Direct and Indirect Anaphora for Japanese Definite Noun Phrases2009
- 著者名/発表者名
  Naoya Inoue, Ryu Iida, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of Conference of the Pacific Association for Computational Linguistics (PACLING)
- NAID
  10027016150
- 関連する報告書
  2009 実績報告書
- 査読あり
[学会発表] 拡張モダリティタグ付与コーパスの設計と構築2011
- 著者名/発表者名
  松吉俊, 佐尾ちとせ, 乾健太郎, 松本裕治
- 学会等名
  言語処理学会第17回年次大会
- 発表場所
  愛知県豊橋市豊橋技術科学大学
- 年月日
  2011-03-08
- 関連する報告書
  2010 実績報告書
[学会発表] 自然言語処理の新展開とウェブ情報編集の未来像2010
- 著者名/発表者名
  乾健太郎
- 学会等名
  東北大学大学院国際文化研究科第11回「言語・脳・認知」コロキアム
- 発表場所
  東北大学
- 年月日
  2010-12-01
- 関連する報告書
  2010 実績報告書
[学会発表] 大規模言語/世界知識に基づく次世代Web情報分析2010
- 著者名/発表者名
  乾健太郎
- 学会等名
  電子情報通信学会コンピュテーション研究会
- 発表場所
  東北大学
- 年月日
  2010-10-15
- 関連する報告書
  2010 実績報告書
[学会発表] コーパスへの意味的注釈の重層的付与2010
- 著者名/発表者名
  乾健太郎
- 学会等名
  英語コーパス学会第36回大会シンポジウム「コーパスにおける言語的注釈と自然言語処理技術」
- 発表場所
  東京大学
- 年月日
  2010-10-09
- 関連する報告書
  2010 実績報告書
[学会発表] 大規模知識に基づく言語情報処理と次世代ウェブ情報編集の可能性2010
- 著者名/発表者名
  乾健太郎
- 学会等名
  北海道大学大学院情報科学研究科GCOE講演会
- 発表場所
  北海道大学
- 年月日
  2010-06-30
- 関連する報告書
  2010 実績報告書
[学会発表] 大規模言語/世界知識に基づくWeb情報編集の高度化2010
- 著者名/発表者名
  乾健太郎
- 学会等名
  電子情報通信学会思考と言語研究会
- 発表場所
  東京
- 年月日
  2010-05-28
- 関連する報告書
  2010 実績報告書
[学会発表] モダリティ、真偽情報、価値情報を統合した拡張モダリティ解析2010
- 著者名/発表者名
  江口萌, 松吉俊, 佐尾ちとせ, 乾健太郎, 松本裕治
- 学会等名
  言語処理学会第16回年次大会論文集
- 発表場所
  東京
- 年月日
  2010-03-09
- 関連する報告書
  2009 実績報告書
[学会発表] 次世代Web情報編集のための言語情報処理技術2009
- 著者名/発表者名
  乾健太郎
- 学会等名
  ニフティ技術講演会,招待講演
- 発表場所
  東京
- 年月日
  2009-10-23
- 関連する報告書
  2009 実績報告書
[学会発表] 日本語文章の事象に対する判断情報アノテーション2009
- 著者名/発表者名
  江口萌, 松吉俊, 佐尾ちとせ, 乾健太郎, 松本裕治
- 学会等名
  情報処理学会研究報告,自然言語処理研究会,2009-NL-193
- 発表場所
  京都
- 年月日
  2009-09-28
- 関連する報告書
  2009 実績報告書
[学会発表] 言語情報編集と意味処理基盤2009
- 著者名/発表者名
  乾健太郎
- 学会等名
  大阪市立大学大学院創造都市研究科ワークショップ,招待講演
- 発表場所
  大阪
- 年月日
  2009-06-10
- 関連する報告書
  2009 実績報告書

経験マイニング技術の高度化と実用化

研究代表者

乾 健太郎 東北大学, 大学院・情報科学研究科, 教授 (60272689)

4,900千円 (直接経費: 4,900千円)

報告書

研究成果

[雑誌論文] Mining Personal Experiences and Opinions from Web Documents2011

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Recognizing Confinement in Web Texts2011

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Dependency Syntax Analysis Using Grammar Induction and a Lexical Categories Precedence System2011

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Co-related Verb Argument Selectional Preferences2011

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Resolving Direct and Indirect Anaphora for Japanese Definite Noun Phrases2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 述語項構造と照応関係のアノテーション:NAISTテキストコーパス構築の経験から2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] テキスト情報分析のための判断情報アノテーション2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Annotating event mentions in text with modality, focus, and source information2010

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Structured Model for Joint Learning of Argument Roles and Predicate Senses2010

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Automatic Classification of Semantic Relations between Facts and Opinions2010

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Statement Map : Reducing Web Information Credibility Noise through Opinion Classification2010

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 項の共有関係と統語パターンを用いた事態間関係獲得2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Resolving Direct and Indirect Anaphora for Japanese Definite Noun Phrases2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 共起パターンの学習による事態間関係知識の獲得2009

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Capturing Salience with a Trainable Cache Model for Zero-anaphora Resolution2009

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Resolving Direct and Indirect Anaphora for Japanese Definite Noun Phrases2009

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] 拡張モダリティタグ付与コーパスの設計と構築2011

著者名/発表者名

学会等名

乾健太郎東北大学, 大学院・情報科学研究科, 教授 (60272689)