2010 年度実績報告書

音声中の感情認識のための新しい認識方略に関する研究

研究課題

研究課題/領域番号	22650032
研究機関	北陸先端科学技術大学院大学
研究代表者	赤木正人北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
研究分担者	鵜木祐史北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (00343187) 宮内良太北陸先端科学技術大学院大学, 情報科学研究科, 助教 (30455852) 李軍鋒北陸先端科学技術大学院大学, 情報科学研究科, 助教 (50431466)
キーワード	音声認識 / 感情音声 / 音声知覚モデル / 感情基本因子 / 対話解析
研究概要	音声には大きく分けて言語情報(何を話しているか)と非言語情報(感情,個人性等)が含まれる.音声コミュニケーションではこれら両方が送受されている,このため,音声対話の精緻な解析のためにはこれら双方を考慮する必要がある.特に人-人の対話解析に基づいて人-機械のインターフェースを構築しようとする場合,言語情報(音声認識)だけではなく,話し手の感情がどのように変化しているかという情報(感情認識)は重要な要素となる.本研究では,感情を複数の基本因子ベクトルの合成ベクトルとして表現するという新しい発想のもと,研究代表者らが提案している音声中の感情知覚モデルを感情音声認識に適用し,感情が複数含まれる音声からそれぞれの感情の程度までを推定する手法を確立することを目的とする. このために1年目は,感情音声知覚モデルの認識システムへの移行のための整備を行った.具体的には,感情音声合成で用いていた三層構造感情知覚モデルを,表現豊かな音声の特質を扱う目的で,感情空間の表現として感情基本因子を付け加えることにより四階層構造(音響特徴量,温床表現語群,感情基本因子,感情)とした.感情基本因子としては,"怒り","恐れ","喜び"などのラベルではなく,感情の印象を表現できるActivation-Evaluation-Dominanceの3次元を採用した.この結果として,感情を複数の基本因子ベクトルの合成ベクトルとしてより簡単に表現できるようになり,認識システムの構築が容易となった.

研究成果
(5件)

すべて 2011 2010

すべて雑誌論文 (3件) (うち査読あり 2件) 学会発表 (2件)

[雑誌論文] A hybrid speech emotion recognition system based on spectral and prosodic features2010
- 著者名/発表者名
  Yu Zhou, Junfeng Li, Yanqing Sun, Jianping Zhang, Yonghong Yan , Masato Akagi
- 雑誌名
  
  IEICE Trans on Information and Systems
  
  巻: Vol.E93-D, No.10 ページ: 2813-2821
- 査読あり
[雑誌論文] Comparison of emotion perception among different cultures2010
- 著者名/発表者名
  Dang, J., Li, A., Erickson, D., Suemitsu, A., Akagi, M., Sakuraba, K., Mienmatasu, N., Hirose, K.
- 雑誌名
  
  Acoustic Science and Technology
  
  巻: 31, 6 ページ: 394-402
- 査読あり
[雑誌論文] 音声に含まれる感情情報の認識-感情空間をどのように表現するか2010
- 著者名/発表者名
  赤木正人
- 雑誌名
  
  日本音響学会誌
  
  巻: 66, 8 ページ: 393-398
[学会発表] 音声の知覚と認識-人は脳で音声を聞く.機械は2011
- 著者名/発表者名
  赤木, 羽二生
- 学会等名
  日本音響学会平成23年春季研究発表会
- 発表場所
  早稲田大学(東京)(招待講演)
- 年月日
  2011-03-09
[学会発表] Rule based voice conversion derived from expressive speech perception model How do computers sing a song joyfully?2010
- 著者名/発表者名
  Akagi, M.
- 学会等名
  International Symposium on Chinese Spoken Language Processing 2010
- 発表場所
  成功大学(Tainan, Taiwan)(招待講演)
- 年月日
  2010-11-29

2010 年度 実績報告書

音声中の感情認識のための新しい認識方略に関する研究

研究代表者

赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)

研究成果

[雑誌論文] A hybrid speech emotion recognition system based on spectral and prosodic features2010

著者名/発表者名

雑誌名

[雑誌論文] Comparison of emotion perception among different cultures2010

著者名/発表者名

雑誌名

[雑誌論文] 音声に含まれる感情情報の認識-感情空間をどのように表現するか2010

著者名/発表者名

雑誌名

[学会発表] 音声の知覚と認識-人は脳で音声を聞く.機械は2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Rule based voice conversion derived from expressive speech perception model How do computers sing a song joyfully?2010

著者名/発表者名

学会等名

発表場所

年月日

2010 年度実績報告書

赤木正人北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)