研究課題
テキストにおける感情を扱う際の第一ステップとしては、単語の感情極性分類(各単語が良い意味か悪い意味かを判定)がある。我々はこの問題に対し、統計物理的アプローチを提案している。まず、辞書、シソーラス(類義語辞典)、コーパスデータを用いて、極性が同じになりやすい単語ペアを抽出する。そしてそれらのペアを連結することにより巨大な語彙ネットワークを構築する。例えば、「良い」と「良好」が類義語関係にあるので、この二単語を結ぶなどの作業を行う。ここで、単語の感情極性を電子スピンの方向とみなし、語彙ネットワークをスピン系とみなして、語彙ネットワークの状態(各スピンがどの方向を向いているか)を計算する。この計算結果を見ることにより、単語の感情極性を自動的に決定する手法を開発した。次に単語から一つレベルを上げて、句の感情極性を考える。つまり、「ノートパソコンが厚い」はネガティブ(悪い意味)だが、「ステーキが厚い」はポジティブ(良い意味)であることを判定したい。我々は、この問題に対し、隠れ変数モデルと呼ばれる、単語のクラスタ(似た単語のグループ)を自動的に発見するような枠組を用いることを提案している。これにより、例えば、厚いことがポジティブであるような名詞が集まったクラスタを自動的に発見することができ、それにより正確な分類が可能になる。このような手法を実現した。また、感情表現や評価表現が現れやすい文脈を自動的に学習していくことにより、表現を分類する手法も提案している。これは、半教師付き学習として有名なEMアルゴリズムを利用することにより実現している。開発手法は、ウェブログデータに対して数値実験を行い、その有効性が示されている。
すべて 2006 2005
すべて 雑誌論文 (5件) 産業財産権 (1件)
情報処理学会論文誌ジャーナル 47巻2号
ページ: 627-637
Proceedings of the 6th International Gonference on Intellignt Text Processing and Computational Linguistics
ページ: 502-513
Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (掲載決定)
Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics (ACL2005)
ページ: 133-140
情報処理学会研究報告, 自然言語処理研究会 2005-NL-169
ページ: 141-148