研究概要 |
本研究は,インターネット上の情報を,「感情的な表現」から分類し,その分布を自動集計するシステムの開発を目的とする.そのために,言語表現を解析するための知識ベースシリーズの拡充と現状のインターネット上ドキュメントの収集が課題となる. 本年度は,次の4点を行った.1:感情動作・感情状態を表す用言のパターン辞書を整備し,感情解析を試みた.その結果,パターン辞書を運用した解析手法が良好に動作することを確認した.2:感情や対話行為のタグ付きコーパスの整備を行い,感情を表す文頭・文中・文末の表現を分析する基礎データを構築することができた.特に,対話行為タグは,文末表現が意図を表す場合と感情を表す場合とを見分けるための良い情報であることが分かった.3:図書「日本語文型辞典(くろしお出版)」に掲載された接続表現172件に対して感情表現性を分析したところ,接続表現には,特定の感情を表すものは53件,感情の変化点や保持を表すものは16件がそれぞれ存在するということが分かった.4:平成19年度のインターネットドキュメントのサンプルを収集した.今後も安定的にデータを収集するために,Yahooのカテゴリを基準とした収集とした. 以上により,パターン言語処理に基づく感情解析処理の基本データを得ることができ,次年度(H20,H21年度)における本研究課題を進める基礎を固めることができた.とりわけ,接続表現における感情表現性については,「接続表現の語義の表す感情」と「文章上で実際に伴い易い感情」というものに違いがありうるので,今後も分析を深める必要がある. 感情的な言語表現を解析するための知識ベースシリーズ(感情語彙,感情原因,感情反応,文頭・文中・文末の感情表現)を構築する方法は,情報処理産業からのニーズが高い基礎技術である.本年度の取り組みはそのための基礎理論の位置づけである.
|