2012 Fiscal Year Annual Research Report
音声中の感情認識のための新しい認識方略に関する研究
Project/Area Number |
22650032
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
|
Co-Investigator(Kenkyū-buntansha) |
鵜木 祐史 北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (00343187)
宮内 良太 北陸先端科学技術大学院大学, 情報科学研究科, 助教 (30455852)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 音声認識 / 感情音声 / 音声知覚モデル / 感情基本因子 / 対話解析 |
Research Abstract |
音声には大きく分けて言語情報(何を話しているか)と非言語情報(感情,個人性等)が含まれる。このため,音声対話の精緻な解析のためにはこれら双方を考慮する必要がある。特に人-人の対話解析に基づいて人-機械のインターフェースを構築しようとする場合,言語情報(音声認識)だけではなく,話し手の感情がどのように変化しているかという情報(感情認識)は重要な要素となる。本研究では,感情を複数の基本因子ベクトルの合成ベクトルとして表現するという新しい発想のもと,研究代表者らが提案している音声中の感情知覚モデルを感情音声認識に適用し,感情が複数含まれる音声からそれぞれの感情の程度までを推定する手法を確立することを目的とする。 24年度は,最終年度として,提案している三層構造感情知覚モデルを用いて,①推定された感情基本因子ベクトルArousal-Valence-Dominanceの組み合わせにより感情空間へのマッピングを行う手法について検討を行うことを試みるとともに,②音声認識パイロットシステムの構築を行い,感情認識実験を通してシステムの評価を行った。 ①については,感情空間へのマッピングについて,聴取実験から得られたヒトの応答特性と比較した結果,従来手法よりもヒトの応答特性の模擬性能は高くなっており,三層構造感情知覚モデルとファジイシステムを組み合わせた場合に,最も性能が高いことが分かった。また,精度が高くなるために入力音声特徴についても議論し,適切な入力の組み合わせを見つけることができた。 ②については,感情認識実験の精度を議論した。日本語およびドイツ語の感情音声に対して,本手法と従来手法であるGMMを用いた手法を適用した場合の認識精度を比較した結果,本手法が認識率で大きく優れていることが確認できた。 これらの結果は,査読付き国際会議で1件発表済みであり,学会誌へ1件投稿中である。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(3 results)