Research Abstract |
本研究の目的は,感情の自動抽出のための言語知識ベースの構築である.本知識ベースは,日本語の用言の語義(語義は結合価パターンで表現される)とその対応する感情へのリンク,および,感情に対応する詳細な前提条件へのリンクで構成する.本年度は前者のリンクの改訂,後者のリンクの処理方法の検討,および,感情推定の実験である. 本年度に,まず,知識ベース構築のために進めた内容は,次の2点である:(1)前者の語義と感情のリンクについて複数の分析者による対応関係の検査,(2)後者の前提条件のリンクを計算機処理するためのアルゴリズムの検討.次に,構築した知識ベースの性能評価のために進めた内容は次の1点である:(3)感情推定の正解データとなるコーパスの構築. 各内容の実施結果は以下のとおりとなった:(1)約14,800件の結合価パターンに対してブラッシュアップ作業を行った結果,昨年度の知識ベースの不備が約2,000件存在することが判明し,正しく修正することができた.感情推定を机上で行ったところ人間による感情推定の正解率に近い評価を得た.(2)上述の前提条件は,因果関係,時間的経過,対象物と評価表現などの事象・属性の関係に関する条件である.最近の言語処理技術では重文・複文の表現が注目され始め,このような条件の判定に重文・複文が利用されつつある.そこで12万件の重文・複文コーパスを用いて前提条件の判定処理の例題検討を行ったところ,実現可能性の確認ができた.(3)インターネットの掲示板等には,日記形式と対話形式がみられた.掲示板の文章は,著者の感情が正確には得られにくい部分があるため,信頼性の高いコーパスの構築は,さらなる研究課題となってしまう.そこで,本研究では,感情表現のカテゴリが明示された日記の書き方の図書,漫画における対話場面(表情により感情が明確)を対象に感情タグを有するコーパスを構築した(2,000文から30,000文の規模).いずれも複数の分析者が1つの話に対してタグを付与したため,信頼性のあるコーパスが構築できた. 以上により本年度の課題が達成できたといえる.そして,来年度に向けての準備も整いつつあると言える.
|