研究概要 |
インターネット上の情報を,「感情的な表現」から分類し, その分布を自動集計するシステムの開発を目的とする. そのために, 感情的な表現の解析知識ベースシリーズの拡充, インターネット上のテキストドキュメントに対する感情的な表現の分布調査ツールの試作を行う. 本年度は, まず, 知識ベースシリーズの拡充に向けて, 文末表現(口調)および接続表現の知識ベース化を進めた. その結果, テキスト対話(メール文)における口調の厳しさ/優しさに対する判定が可能であること, および, ブログ記事における接続表現による感情的な極性(Positive/Negative)に対する判定がやや可能であることを実験的に確認した. 次に, ディレクトリ型検索ページの記事およびRSS発信されるブログ記事を対象とした感情的表現分布調査ツールを試作したところ, 検索ページ(約8千サイト)からは約7GB, ブログ記事(約6.5千万件)からは約20GBのテキストを得た. さらに, 本研究で開発した知識ベースシリーズのうち用言バターン辞書を運用段階に高めて, 感情的な表現の解析を行ったところ, 感情の向けられている対象についてキーワードを得ることが出来た. 以上の結果より, 人々の興味・関心・要求・不満などの対象が観測可能となり, 今後, マーケティングや政策などの分野に効果をもたらすと予想される.
|