2012 Fiscal Year Annual Research Report

音声中の感情認識のための新しい認識方略に関する研究

Research Project

Project/Area Number	22650032
Research Institution	Japan Advanced Institute of Science and Technology
Principal Investigator	赤木正人北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
Co-Investigator(Kenkyū-buntansha)	鵜木祐史北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (00343187) 宮内良太北陸先端科学技術大学院大学, 情報科学研究科, 助教 (30455852)
Project Period (FY)	2010-04-01 – 2013-03-31
Keywords	音声認識 / 感情音声 / 音声知覚モデル / 感情基本因子 / 対話解析
Research Abstract	音声には大きく分けて言語情報（何を話しているか）と非言語情報（感情，個人性等）が含まれる。このため，音声対話の精緻な解析のためにはこれら双方を考慮する必要がある。特に人－人の対話解析に基づいて人－機械のインターフェースを構築しようとする場合，言語情報（音声認識）だけではなく，話し手の感情がどのように変化しているかという情報（感情認識）は重要な要素となる。本研究では，感情を複数の基本因子ベクトルの合成ベクトルとして表現するという新しい発想のもと，研究代表者らが提案している音声中の感情知覚モデルを感情音声認識に適用し，感情が複数含まれる音声からそれぞれの感情の程度までを推定する手法を確立することを目的とする。 24年度は，最終年度として，提案している三層構造感情知覚モデルを用いて，①推定された感情基本因子ベクトルArousal-Valence-Dominanceの組み合わせにより感情空間へのマッピングを行う手法について検討を行うことを試みるとともに，②音声認識パイロットシステムの構築を行い，感情認識実験を通してシステムの評価を行った。 ①については，感情空間へのマッピングについて，聴取実験から得られたヒトの応答特性と比較した結果，従来手法よりもヒトの応答特性の模擬性能は高くなっており，三層構造感情知覚モデルとファジイシステムを組み合わせた場合に，最も性能が高いことが分かった。また，精度が高くなるために入力音声特徴についても議論し，適切な入力の組み合わせを見つけることができた。 ②については，感情認識実験の精度を議論した。日本語およびドイツ語の感情音声に対して，本手法と従来手法であるGMMを用いた手法を適用した場合の認識精度を比較した結果，本手法が認識率で大きく優れていることが確認できた。これらの結果は，査読付き国際会議で1件発表済みであり，学会誌へ1件投稿中である。
Current Status of Research Progress	Reason 24年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	24年度が最終年度であるため、記入しない。

Research Products
(3 results)

All 2012 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results)

[Journal Article] Speech Emotion Recognition System Based on a Dimensional Approach Using a Three-Layered Model2012
- Author(s)
  Elbarougy, R. and Akagi, M.
- Journal Title
  
  Proc. APSIPA2012
  
  Volume: - Pages: CD-ROM
- Peer Reviewed
[Presentation] Comparison of methods for emotion dimensions estimation in speech using a three-layered model
- Author(s)
  Elbarougy, R. and Akagi, M.
- Organizer
  IEICE Tech. Report, SP2012-36
- Place of Presentation
  Atsugi
[Presentation] Automatic Speech Emotion Recognition Using A Three Layer Model
- Author(s)
  Elbarougy, R. and Akagi, M.
- Organizer
  IEICE Tech. Report, SP2012-127
- Place of Presentation
  Nagoya

2012 Fiscal Year Annual Research Report

音声中の感情認識のための新しい認識方略に関する研究

Principal Investigator

赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)

Reason

Research Products

[Journal Article] Speech Emotion Recognition System Based on a Dimensional Approach Using a Three-Layered Model2012

Author(s)

Journal Title

[Presentation] Comparison of methods for emotion dimensions estimation in speech using a three-layered model

Author(s)

Organizer

Place of Presentation

[Presentation] Automatic Speech Emotion Recognition Using A Three Layer Model

Author(s)

Organizer

Place of Presentation

赤木正人北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)