Budget Amount *help |
¥3,600,000 (Direct Cost: ¥3,600,000)
Fiscal Year 2006: ¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 2005: ¥2,000,000 (Direct Cost: ¥2,000,000)
|
Research Abstract |
本研究の目的は,感情の自動抽出のための言語知識ベースの構築である.本知識ベースは,日本語の用言の語義(語義は結合価パターンで表現される)とその対応する感情についての属性情報で構成する.本年度の具体的な達成目標は,(1)用言の格関係を基盤とした感情抽出用の知識ベースの構築,および,(2)日記文などから(1)を用いて感情を推定する機構の試作である. 本年度に実施した内容は次の通りである.(1)本知識ベースを運用するための「構造照合型パターン検索システム」の構築,(2)本知識ベースを基盤とした日本語の用言の分布調査,(3)日記文に対する感情推定の実験である.(1)で構築したシステムは日英機械翻訳のためのパターン記述仕様に従い構築したが,本知識ベースと互換性があり,十万件規模のパターンを扱うことができる.こうして実験準備ができた.(2)本知識ベースは日本語の基本的な用言を網羅しているため,感情推定において曖昧性の高い用言,感情面からの類似性のある用言などの性質を分析することができた.日本語研究における1つの基礎的資料といえる.(3)SNSやblogで見られるようにインターネット上の記述には日記形式の文章が多く,人々の悩みや意見など感情面から抽出することが期待されるため,本実験では日記文を対象に本知識ベースによる感情推定を実験した.日記文の1,642節において,本知識ベースが処理対象とする形式の節(感情の原因を表す節)は215節存在したが,感情を直接表現したり感情的反応を表現する合計205節と同程度存在したことより,感情の原因に着目した感情推定の必要性が確認できたこと,および,その推定処理の性能が,人間による性能が50%〜61%の正解率であるところに対して48%であったことより,基本的に本知識ベースの正しさが確認できた. 以上により,本研究課題において,感情的原因による感情推定のための言語知識ベース(約14,800パターンを収録)を構築することができたこと,日本語用言における感情的原因に関する分布という基礎的な知見を得たこと,および,インターネット上で多く見られる日記形式の文における感情解析性能の確認ができたことが主たる成果である.
|