研究概要 |
本研究で構築する情報分布調査システムは,感情推定器,Webドキュメントのクローラー,および,統計解析器で構成される.これらの実装を行い,前年度に収集したWebドキュメントに対して感情推定を実施し,情報分布を検討した.感情推定器に用いる知識として感情の原因表現,直接表現,および,反応表現を用いたところ,人間による感情推定の一致率が60%程度であったことに対して,同程度の性能が得られた.感情推定の性能を高めるために,文中表現,文末表現,および,接続表現の知識ベース化および実装を予定していたが,先述の知識で十分であったため,新たな知識ベース化の進捗を遅くした(ただし,864件の文末表現パターンと178件の接続表現の考察は完了した).その代わりに,統計解析器に対する考察を深め,情報分布の調査を試みた.統計解析器は,Z-スコアおよび感情共起確率を算出する.時系列上に感情対象となったキーワードの頻度を求め,Z-スコアによりトレンドを算出することができる.感情共起確率により人々の嗜好や不満を見分けることができる.これらに基づき情報の分布を鳥瞰する方法は2通りある.1つはキーワードを指定して,時系列上で頻度と感情共起確率を観測することである.これにより,人々が注意を向けた時期が分かるとともに,Webドキュメントを読むことで,人々の関心の理由が確認できた.もう1つは,ある時期においてZ-スコアの高い(流行している)キーワードを多数抽出し,それぞれの感情共起確率で分類することで感情対象の分布を観測することである.その結果,「オリンピック」などトレンドに追従してキーワードが得られるとともに,分析者が予想していなかった事柄が流行していることやそれに対する人々の好き嫌いが確認できた(たとえば,夏に「天ぷら」が好まれていたなど).こうして,マーケティングや政策のヒントを得ることに有効であるという見込みを得た.
|