Speech Emotion Recognition Based on Extracting Features for Emotion Expression
Project/Area Number |
20K11898
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Ritsumeikan University |
Principal Investigator |
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Project Status |
Completed (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 音声感情認識 / 言語情報 / ソフトラベル / 話題 / 短区間 / CTC / 文字付き感情ラベル / 音声 / 感情認識 / パラ言語情報 / マルチモーダル / 感情音声 |
Outline of Research at the Start |
音声は人がコミュニケーションを行うための自然かつ容易なチャンネルであり,文字テキストで記述される言語情報だけでなく,感情,意図,年齢,性別といった音声の書き起こしテキストでは記述されないパラ言語・非言語情報も伝達する。本研究では,音声に含まれる話者の感情を自動認識する手法を開発することが目的である。音声から得られる特徴パラメータベクトルは,音韻性,話者性,感情性によって変動する。発話ごとに得られる特徴パラメータベクトルから感情性を抽出する手法を開発し,音声における感情を精度良く自動認識することを目指す。
|
Outline of Final Research Achievements |
Speech conveys not only verbal information but also paralinguistic information such as emotions. In conversations between people, such paralinguistic information is used naturally to achieve smooth dialogue. Emotion recognition plays an important role in realizing smooth information exchange by speech between humans and machines. In order to improve the performance of speech emotion recognition, we proposed new methods and confirmed their effectiveness as follows; (1) speech emotion recognition using both acoustic and linguistic features, (2) emotion recognition model training using soft labels, (3) speech emotion recognition using topics, and (4) speech emotion recognition for short segments of speech.
|
Academic Significance and Societal Importance of the Research Achievements |
音声認識技術の急速な進歩によって、音声から文字テキストへの変換は実用化されたと言ってよい状況になっている一方で、音声が伝達する情報のうち、感情など言語情報以外の情報の自動認識はまだ発展途上にある。本研究では、音声における感情認識の性能を向上させるための手法を開発した。また、音声においては、一発話の途中で感情が変化することは一般的に起こりうることであり、音声における短い単位に対して感情を推定する手法の開発が求められており、音声の短区間を対象とする感情認識の手法についても取り組んだ。
|
Report
(4 results)
Research Products
(7 results)