研究課題/領域番号 |
20K11898
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 立命館大学 |
研究代表者 |
山下 洋一 立命館大学, 情報理工学部, 教授 (80174689)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 音声感情認識 / 言語情報 / ソフトラベル / 話題 / 短区間 / CTC / 文字付き感情ラベル / 音声 / 感情認識 / パラ言語情報 / マルチモーダル / 感情音声 |
研究開始時の研究の概要 |
音声は人がコミュニケーションを行うための自然かつ容易なチャンネルであり,文字テキストで記述される言語情報だけでなく,感情,意図,年齢,性別といった音声の書き起こしテキストでは記述されないパラ言語・非言語情報も伝達する。本研究では,音声に含まれる話者の感情を自動認識する手法を開発することが目的である。音声から得られる特徴パラメータベクトルは,音韻性,話者性,感情性によって変動する。発話ごとに得られる特徴パラメータベクトルから感情性を抽出する手法を開発し,音声における感情を精度良く自動認識することを目指す。
|
研究成果の概要 |
音声は言語情報だけでなく、感情などのパラ言語情報も伝達する。人同士の対話では、そのようなパラ言語情報も自然に利用することでスムーズな対話が実現されている。人と機械の間での音声による円滑な情報交換を実現するには、感情の認識が重要な枠割を果たす。音声における感情認識の性能向上を実現するために、(1) 音響的特徴と言語的特徴を併用した音声感情認識、(2) ソフトラベルを利用した感情認識モデルの学習、(3) 話題を利用した音声感情認識、(4) 音声の短区間を対象とした音声感情認識、の課題に対して、新たな手法を提案し、各手法の有効性を確認した。
|
研究成果の学術的意義や社会的意義 |
音声認識技術の急速な進歩によって、音声から文字テキストへの変換は実用化されたと言ってよい状況になっている一方で、音声が伝達する情報のうち、感情など言語情報以外の情報の自動認識はまだ発展途上にある。本研究では、音声における感情認識の性能を向上させるための手法を開発した。また、音声においては、一発話の途中で感情が変化することは一般的に起こりうることであり、音声における短い単位に対して感情を推定する手法の開発が求められており、音声の短区間を対象とする感情認識の手法についても取り組んだ。
|