研究課題/領域番号 |
22650032
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
|
研究分担者 |
鵜木 祐史 北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (00343187)
宮内 良太 北陸先端科学技術大学院大学, 情報科学研究科, 助教 (30455852)
|
研究期間 (年度) |
2010-04-01 – 2013-03-31
|
キーワード | 音声認識 / 感情音声 / 音声知覚モデル / 感情基本因子 / 対話解析 |
研究概要 |
音声には大きく分けて言語情報(何を話しているか)と非言語情報(感情,個人性等)が含まれる。このため,音声対話の精緻な解析のためにはこれら双方を考慮する必要がある。特に人-人の対話解析に基づいて人-機械のインターフェースを構築しようとする場合,言語情報(音声認識)だけではなく,話し手の感情がどのように変化しているかという情報(感情認識)は重要な要素となる。本研究では,感情を複数の基本因子ベクトルの合成ベクトルとして表現するという新しい発想のもと,研究代表者らが提案している音声中の感情知覚モデルを感情音声認識に適用し,感情が複数含まれる音声からそれぞれの感情の程度までを推定する手法を確立することを目的とする。 24年度は,最終年度として,提案している三層構造感情知覚モデルを用いて,①推定された感情基本因子ベクトルArousal-Valence-Dominanceの組み合わせにより感情空間へのマッピングを行う手法について検討を行うことを試みるとともに,②音声認識パイロットシステムの構築を行い,感情認識実験を通してシステムの評価を行った。 ①については,感情空間へのマッピングについて,聴取実験から得られたヒトの応答特性と比較した結果,従来手法よりもヒトの応答特性の模擬性能は高くなっており,三層構造感情知覚モデルとファジイシステムを組み合わせた場合に,最も性能が高いことが分かった。また,精度が高くなるために入力音声特徴についても議論し,適切な入力の組み合わせを見つけることができた。 ②については,感情認識実験の精度を議論した。日本語およびドイツ語の感情音声に対して,本手法と従来手法であるGMMを用いた手法を適用した場合の認識精度を比較した結果,本手法が認識率で大きく優れていることが確認できた。 これらの結果は,査読付き国際会議で1件発表済みであり,学会誌へ1件投稿中である。
|
現在までの達成度 (区分) |
理由
24年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
24年度が最終年度であるため、記入しない。
|