研究概要 |
音声には大きく分けて言語情報(何を話しているか)と非言語情報(感情,個人性等)が含まれる。このため,音声対話の精緻な解析のためにはこれら双方を考慮する必要がある。特に人-人の対話解析に基づいて人-機械のインターフェースを構築しようとする場合,言語情報(音声認識)だけではなく,話し手の感情がどのように変化しているかという情報(感情認識)は重要な要素となる。本研究では,感情を複数の基本因子ベクトルの合成ベクトルとして表現するという新しい発想のもと,研究代表者らが提案している音声中の感情知覚モデルを感情音声認識に適用し,感情が複数含まれる音声からそれぞれの感情の程度までを推定する手法を確立することを目的とする。 平成23年度は,(1)音響特徴の抽出および知覚モデルの改良を試みるとともに,音声認識システムの構築を目指して,音響特徴の選択と知覚モデルのアルゴリズム化を行った。具体的には,(1)多数の音響特徴から感情基本因子Arousal-Valence-Dominanceの程度の推定,および,(2)複数の感情基本因子からの感情の推定アルゴリズムの構築について研究を行った。また,(2)感情にかかわる音響特徴を選択し,感情の基本となる複数の感情基本因子ベクトルを推定する手法について検討した。これらにより,特に従来難しいとされていたValenceの精度の良い推定が行えるようになり,Arousal-Valence-Dominanceの3つの基本因子ベクトルの合成ベクトルとして感情の推定が行える土台ができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
申請書に記した研究計画において,平成23年度達成目標,1.感情にかかわる音響特徴を選択し,感情の基本となる複数の感情基本因子ベクトルを推定する手法について検討する,2.推定された感情基本因子ベクトルの組み合わせにより,感情空間へのマッピングを行う手法について検討を行う,が達成できたため。
|
今後の研究の推進方策 |
3年目は,当初予定の通り,音声認識パイロットシステムの構築を行い,実環境での大規模音声認識実験を通してシステムの評価を行う。具体的には,(1)平成23年度に選択した感情にかかわる音響特徴から感情の基本となる複数の感情基本因子ベクトル(Arousal-Valence-Dominance)を推定する方法の精度向上を行い,認識システムに組み込む。(2)認識システムを用いて,感情基本因子ベクトルの方向・位置情報から,程度も含めた感情の推定を行う。そして,(3)認識システムの評価を行う。
|