大規模文書データからの意見・感情の自動抽出および分類

研究課題

研究課題/領域番号	16700132
研究種目	若手研究(B)
配分区分	補助金
研究分野	知能情報学
研究機関	東京工業大学
研究代表者	高村大也東京工業大学, 精密工学研究所, 助手 (80361773)
研究期間 (年度)	2004 – 2005
研究課題ステータス	完了 (2005年度)
配分額 *注記	2,900千円 (直接経費: 2,900千円) 2005年度: 700千円 (直接経費: 700千円) 2004年度: 2,200千円 (直接経費: 2,200千円)
キーワード	感情極性 / 感性情報処理 / クラスタリング / 半教師付学習 / 顔文字 / 感情情報処理 / EMアルゴリズム / 意見分類 / 単語の感情極性
研究概要	テキストにおける感情を扱う際の第一ステップとしては、単語の感情極性分類(各単語が良い意味か悪い意味かを判定)がある。我々はこの問題に対し、統計物理的アプローチを提案している。まず、辞書、シソーラス(類義語辞典)、コーパスデータを用いて、極性が同じになりやすい単語ペアを抽出する。そしてそれらのペアを連結することにより巨大な語彙ネットワークを構築する。例えば、「良い」と「良好」が類義語関係にあるので、この二単語を結ぶなどの作業を行う。ここで、単語の感情極性を電子スピンの方向とみなし、語彙ネットワークをスピン系とみなして、語彙ネットワークの状態(各スピンがどの方向を向いているか)を計算する。この計算結果を見ることにより、単語の感情極性を自動的に決定する手法を開発した。次に単語から一つレベルを上げて、句の感情極性を考える。つまり、「ノートパソコンが厚い」はネガティブ(悪い意味)だが、「ステーキが厚い」はポジティブ(良い意味)であることを判定したい。我々は、この問題に対し、隠れ変数モデルと呼ばれる、単語のクラスタ(似た単語のグループ)を自動的に発見するような枠組を用いることを提案している。これにより、例えば、厚いことがポジティブであるような名詞が集まったクラスタを自動的に発見することができ、それにより正確な分類が可能になる。このような手法を実現した。また、感情表現や評価表現が現れやすい文脈を自動的に学習していくことにより、表現を分類する手法も提案している。これは、半教師付き学習として有名なEMアルゴリズムを利用することにより実現している。開発手法は、ウェブログデータに対して数値実験を行い、その有効性が示されている。

報告書

(2件)

2005 実績報告書
2004 実績報告書

研究成果
(12件)

すべて 2006 2005 2004

すべて雑誌論文 (11件) 産業財産権 (1件)

[雑誌論文] スピンモデルによる単語の感情極性抽出2006
- 著者名/発表者名
  高村大也, 乾孝司, 奥村学
- 雑誌名
  
  情報処理学会論文誌ジャーナル 47巻2号
  
  ページ: 627-637
- NAID
  110004081271
- 関連する報告書
  2005 実績報告書
[雑誌論文] Application of Semi-supervised Learning to Evaluative Expression Classification2006
- 著者名/発表者名
  Yasuhiro Suzuki.Hiroya Takamura, Manabu Okumura
- 雑誌名
  
  Proceedings of the 6th International Gonference on Intellignt Text Processing and Computational Linguistics
  
  ページ: 502-513
- 関連する報告書
  2005 実績報告書
[雑誌論文] Latent Variable Models for Semantic Orientations of Phrases2006
- 著者名/発表者名
  Hiroya Takamura, Takashi Inui, Manabu Okumura
- 雑誌名
  
  Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (掲載決定)
- NAID
  110004852731
- 関連する報告書
  2005 実績報告書
[雑誌論文] Extracting Semantic Orientations of Words using Spin Model2005
- 著者名/発表者名
  Hiroya Takamura, Takashi Inui, Manabu Okumura
- 雑誌名
  
  Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics (ACL2005)
  
  ページ: 133-140
- NAID
  110002949448
- 関連する報告書
  2005 実績報告書
[雑誌論文] 極性反転に対応した評価表現モデル2005
- 著者名/発表者名
  高村大也, 乾孝司, 奥村学
- 雑誌名
  
  情報処理学会研究報告, 自然言語処理研究会 2005-NL-169
  
  ページ: 141-148
- NAID
  110003278944
- 関連する報告書
  2005 実績報告書
[雑誌論文] Extraction and Classification of Facemarks with Kernel Methods2005
- 著者名/発表者名
  Yuki Tanaka, Hiroya Takamura, Manabu Okumura
- 雑誌名
  
  Proceedings of the International Conference on Intelligent User Interfaces (IUI2005)
  
  ページ: 28-34
- 関連する報告書
  2004 実績報告書
[雑誌論文] Sentiment Classification using Word Sub-Sequences and Dependency Sub-Trees2005
- 著者名/発表者名
  Shotaro Matsumoto, Hiroya Takamura Manabu Okumura
- 雑誌名
  
  Proceedings of the 9th Pacific-Asia International Conference on Knowledge Discovery and Data Mining (発表予定)
- 関連する報告書
  2004 実績報告書
[雑誌論文] Semi-Supervisedな学習手法による評価表現の分類2005
- 著者名/発表者名
  鈴木泰裕, 高村大也, 奥村学
- 雑誌名
  
  言語処理学会第11回年次大会発表論文集
  
  ページ: 668-672
- 関連する報告書
  2004 実績報告書
[雑誌論文] スピンモデルの感情情報処理への応用2005
- 著者名/発表者名
  高村大也, 乾孝司, 奥村学
- 雑誌名
  
  言語処理学会第11回年次大会発表論文集
  
  ページ: 648-652
- 関連する報告書
  2004 実績報告書
[雑誌論文] 単語の系列及び依存木を用いた評価文書の自動分類2004
- 著者名/発表者名
  松本翔太郎, 高村大也, 野村学
- 雑誌名
  
  第3回情報科学技術フォーラム(FIT 2004)
- 関連する報告書
  2004 実績報告書
[雑誌論文] Extracting Emotional Polarity of Words using Spin Model2004
- 著者名/発表者名
  Hiroya Takamura, Takashi Inui, Manabu Okumura
- 雑誌名
  
  Active Mining 2004
  
  ページ: 207-212
- NAID
  110003205594
- 関連する報告書
  2004 実績報告書
[産業財産権] 感情極性抽出装置、感情極性抽出方法、感情極性抽出プログラム及び感情極性抽出プログラム記録媒体2005
- 発明者名
  高村大也他
- 権利者名
  国立大学法人東京工業大学
- 産業財産権番号
  2005-161802
- 出願年月日
  2005-06-01
- 関連する報告書
  2005 実績報告書

大規模文書データからの意見・感情の自動抽出および分類

研究代表者

高村 大也 東京工業大学, 精密工学研究所, 助手 (80361773)

2,900千円 (直接経費: 2,900千円)

報告書

研究成果

[雑誌論文] スピンモデルによる単語の感情極性抽出2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Application of Semi-supervised Learning to Evaluative Expression Classification2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Latent Variable Models for Semantic Orientations of Phrases2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Extracting Semantic Orientations of Words using Spin Model2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 極性反転に対応した評価表現モデル2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Extraction and Classification of Facemarks with Kernel Methods2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Sentiment Classification using Word Sub-Sequences and Dependency Sub-Trees2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Semi-Supervisedな学習手法による評価表現の分類2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] スピンモデルの感情情報処理への応用2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 単語の系列及び依存木を用いた評価文書の自動分類2004

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Extracting Emotional Polarity of Words using Spin Model2004

著者名/発表者名

雑誌名

NAID

関連する報告書

[産業財産権] 感情極性抽出装置、感情極性抽出方法、感情極性抽出プログラム及び感情極性抽出プログラム記録媒体2005

発明者名

権利者名

産業財産権番号

出願年月日

関連する報告書

高村大也東京工業大学, 精密工学研究所, 助手 (80361773)