研究課題/領域番号 |
19K12014
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 山形大学 |
研究代表者 |
小坂 哲夫 山形大学, 大学院理工学研究科, 教授 (50359569)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 感情認識 / 音声対話システム / 深層学習 / 言語情報 / 非言語情報 / 音声認識 / 音声感情認識 / 言語モデル適応 / 音響モデル適応 / ディープラーニング / 感情音声 / 音響モデル / 言語モデル |
研究開始時の研究の概要 |
人対機械の非タスク志向型対話において,感情の伝達は極めて重要になる.感情の伝達は視覚的情報や音声によって行なわれる.本研究では音声によって伝達される感情の推定に焦点を当て研究を行なう.音声による感情は主に,声の大きさ,高さ,時間長といった韻律に現れる.一方発話内容に直接的な感情表現が含まれる場合もある.前者は非言語情報,後者は言語情報と考えられるが,感情推定では両者を適切に融合して利用することが必要になる.本研究では,まず感情音声認識の高精度化を図り言語情報を正確に取得し,さらに言語情報と非言語情報を適切に融合することにより,高い精度の感情推定を実現することを目的とする.
|
研究成果の概要 |
音声を対象とした感情推定の研究は深層学習の利用により大きく進展している.しかし従来は音声に含まれる非言語情報を利用した方法が主流であり,言語情報を利用した方法の検討は不十分であった.本課題では言語情報を利用するため,音声認識により得られた発話内容テキストを利用し感情認識を行った.さらにそれを非言語情報による感情認識と融合し,高精度な感情認識を実現した.最終的には4感情の認識で82.75%の認識率を得た.
|
研究成果の学術的意義や社会的意義 |
音声を対象とした感情認識の研究において,これまでも言語情報と非言語情報を融合した感情認識の検討は様々行われてきたが,最大の問題点は音声認識の性能の低さであった.この性能が低いと正しい言語情報が利用できず,これが融合法のネックとなっていた.本研究ではその問題を克服し,高精度の感情認識を実現した. 音声による感情認識の精度が向上すれば,人間同士の対話に近い人対機械の対話が可能になり,ロボットの活用の幅が広がると考えられる.さらに本技術はコールセンターやメン タルヘルスケアなど音声を使う様々な分野で利用可能と考えられる.
|