本研究では,ツイートのような短い文章から書き手の感情,読み手が感じた印象,読み手が推測した書き手の感情という3種類の感性情報を抽出するための統合的な技術を確立することを目的とし,以下の研究を行った.なお,本研究において,対象とする感情は「喜び,好き,安心,悲しい,嫌い,怖れ,怒り,恥ずかしい,高揚,驚き」の10種類であり,印象は「攻撃的/不愉快,ネガティブ,感じの良い,楽しい/愉快,ポジティブ,ほのぼの,鬱陶しい,怖い」の8種類である. 平成29年度は,アンケート調査を実施し,ツイートを収集するとともに,書き手の感情,読み手が感じた印象,読み手が推測した書き手の感情に関するデータを取得した.また,これらのデータを分析することで,感情どうし,印象どうし,感情と印象の組み合わせに対する対応関係を明らかにした. 平成30年度は,ツイートと印象や感情との対応関係を定式化するとともに,ツイートの印象値(読み手が感じた各印象の強さを示す値)や感情値(読み手が推測した書き手の各感情の強さを示す値)を算出する手法を開発した.また,顔文字がツイートの印象や感情に与える影響を定式化し,顔文字を含まないツイートを対象として設計されている従来手法と組み合わせることで,顔文字付きツイートの印象値や感情値を算出する手法を開発した. 平成31年度(令和元年度)は,ツイートの印象値や感情値を算出するために公開されている複数の従来手法を組み合わせることで,ロバスト性(入力文章の印象値や感情値を算出するにあたって算出不能になりにくい性質)と精度面(交差検定時の平均Root-Mean-Square Error)においてより優れた手法を開発した.
|