研究課題/領域番号 |
16700132
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 東京工業大学 |
研究代表者 |
高村 大也 東京工業大学, 精密工学研究所, 助手 (80361773)
|
研究期間 (年度) |
2004 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
2,900千円 (直接経費: 2,900千円)
2005年度: 700千円 (直接経費: 700千円)
2004年度: 2,200千円 (直接経費: 2,200千円)
|
キーワード | 感情極性 / 感性情報処理 / クラスタリング / 半教師付学習 / 顔文字 / 感情情報処理 / EMアルゴリズム / 意見分類 / 単語の感情極性 |
研究概要 |
テキストにおける感情を扱う際の第一ステップとしては、単語の感情極性分類(各単語が良い意味か悪い意味かを判定)がある。我々はこの問題に対し、統計物理的アプローチを提案している。まず、辞書、シソーラス(類義語辞典)、コーパスデータを用いて、極性が同じになりやすい単語ペアを抽出する。そしてそれらのペアを連結することにより巨大な語彙ネットワークを構築する。例えば、「良い」と「良好」が類義語関係にあるので、この二単語を結ぶなどの作業を行う。ここで、単語の感情極性を電子スピンの方向とみなし、語彙ネットワークをスピン系とみなして、語彙ネットワークの状態(各スピンがどの方向を向いているか)を計算する。この計算結果を見ることにより、単語の感情極性を自動的に決定する手法を開発した。 次に単語から一つレベルを上げて、句の感情極性を考える。つまり、「ノートパソコンが厚い」はネガティブ(悪い意味)だが、「ステーキが厚い」はポジティブ(良い意味)であることを判定したい。我々は、この問題に対し、隠れ変数モデルと呼ばれる、単語のクラスタ(似た単語のグループ)を自動的に発見するような枠組を用いることを提案している。これにより、例えば、厚いことがポジティブであるような名詞が集まったクラスタを自動的に発見することができ、それにより正確な分類が可能になる。このような手法を実現した。 また、感情表現や評価表現が現れやすい文脈を自動的に学習していくことにより、表現を分類する手法も提案している。これは、半教師付き学習として有名なEMアルゴリズムを利用することにより実現している。開発手法は、ウェブログデータに対して数値実験を行い、その有効性が示されている。
|