2005 年度実績報告書

大規模文書データからの意見・感情の自動抽出および分類

研究課題

研究課題/領域番号	16700132
研究機関	東京工業大学
研究代表者	高村大也東京工業大学, 精密工学研究所, 助手 (80361773)
キーワード	感情極性 / 感性情報処理 / クラスタリング / 半教師付学習
研究概要	テキストにおける感情を扱う際の第一ステップとしては、単語の感情極性分類(各単語が良い意味か悪い意味かを判定)がある。我々はこの問題に対し、統計物理的アプローチを提案している。まず、辞書、シソーラス(類義語辞典)、コーパスデータを用いて、極性が同じになりやすい単語ペアを抽出する。そしてそれらのペアを連結することにより巨大な語彙ネットワークを構築する。例えば、「良い」と「良好」が類義語関係にあるので、この二単語を結ぶなどの作業を行う。ここで、単語の感情極性を電子スピンの方向とみなし、語彙ネットワークをスピン系とみなして、語彙ネットワークの状態(各スピンがどの方向を向いているか)を計算する。この計算結果を見ることにより、単語の感情極性を自動的に決定する手法を開発した。次に単語から一つレベルを上げて、句の感情極性を考える。つまり、「ノートパソコンが厚い」はネガティブ(悪い意味)だが、「ステーキが厚い」はポジティブ(良い意味)であることを判定したい。我々は、この問題に対し、隠れ変数モデルと呼ばれる、単語のクラスタ(似た単語のグループ)を自動的に発見するような枠組を用いることを提案している。これにより、例えば、厚いことがポジティブであるような名詞が集まったクラスタを自動的に発見することができ、それにより正確な分類が可能になる。このような手法を実現した。また、感情表現や評価表現が現れやすい文脈を自動的に学習していくことにより、表現を分類する手法も提案している。これは、半教師付き学習として有名なEMアルゴリズムを利用することにより実現している。開発手法は、ウェブログデータに対して数値実験を行い、その有効性が示されている。

研究成果
(6件)

すべて 2006 2005

すべて雑誌論文 (5件) 産業財産権 (1件)

[雑誌論文] スピンモデルによる単語の感情極性抽出2006
- 著者名/発表者名
  高村大也, 乾孝司, 奥村学
- 雑誌名
  
  情報処理学会論文誌ジャーナル 47巻2号
  
  ページ: 627-637
[雑誌論文] Application of Semi-supervised Learning to Evaluative Expression Classification2006
- 著者名/発表者名
  Yasuhiro Suzuki.Hiroya Takamura, Manabu Okumura
- 雑誌名
  
  Proceedings of the 6th International Gonference on Intellignt Text Processing and Computational Linguistics
  
  ページ: 502-513
[雑誌論文] Latent Variable Models for Semantic Orientations of Phrases2006
- 著者名/発表者名
  Hiroya Takamura, Takashi Inui, Manabu Okumura
- 雑誌名
  
  Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (掲載決定)
[雑誌論文] Extracting Semantic Orientations of Words using Spin Model2005
- 著者名/発表者名
  Hiroya Takamura, Takashi Inui, Manabu Okumura
- 雑誌名
  
  Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics (ACL2005)
  
  ページ: 133-140
[雑誌論文] 極性反転に対応した評価表現モデル2005
- 著者名/発表者名
  高村大也, 乾孝司, 奥村学
- 雑誌名
  
  情報処理学会研究報告, 自然言語処理研究会 2005-NL-169
  
  ページ: 141-148
[産業財産権] 感情極性抽出装置、感情極性抽出方法、感情極性抽出プログラム及び感情極性抽出プログラム記録媒体2005
- 発明者名
  高村大也他
- 権利者名
  国立大学法人東京工業大学
- 産業財産権番号
  特願2005-161802
- 出願年月日
  2005-06-01

2005 年度 実績報告書

大規模文書データからの意見・感情の自動抽出および分類

研究代表者

高村 大也 東京工業大学, 精密工学研究所, 助手 (80361773)

研究成果

[雑誌論文] スピンモデルによる単語の感情極性抽出2006

著者名/発表者名

雑誌名

[雑誌論文] Application of Semi-supervised Learning to Evaluative Expression Classification2006

著者名/発表者名

雑誌名

[雑誌論文] Latent Variable Models for Semantic Orientations of Phrases2006

著者名/発表者名

雑誌名

[雑誌論文] Extracting Semantic Orientations of Words using Spin Model2005

著者名/発表者名

雑誌名

[雑誌論文] 極性反転に対応した評価表現モデル2005

著者名/発表者名

雑誌名

[産業財産権] 感情極性抽出装置、感情極性抽出方法、感情極性抽出プログラム及び感情極性抽出プログラム記録媒体2005

発明者名

権利者名

産業財産権番号

出願年月日

2005 年度実績報告書

高村大也東京工業大学, 精密工学研究所, 助手 (80361773)