研究課題/領域番号 |
18K18136
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61060:感性情報学関連
|
研究機関 | 東北大学 |
研究代表者 |
千葉 祐弥 東北大学, 工学研究科, 助教 (30780936)
|
研究期間 (年度) |
2018-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2018年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | ユーザ状態推定 / 音声感情認識 / 音声対話システム / ヘルスケア / 音声情報処理 / ユーザ評価 / マルチモーダル対話システム / パラ言語情報処理 / マルチモーダル情報処理 / 健康状態推定 |
研究成果の概要 |
本課題ではまず,音響的非言語シグナルからユーザ状態の推定を行う手法を検討した.感情音声合成を用いてデータを増強することで音声感情認性能が従来よりも大幅に改善することを示した.また,近年注目を集める系列モデルに対してセグメント特徴量の導入とネットワークのマルチストリーム化を行うことでさらに性能を向上させた.最終的な識別精度は73.4%であり,これは人間による判別に肉薄する結果である.また,対話型システムを継続的に使うための対話制御技術に関しても検討を行った.人間同士のマルチモーダル雑談コーパスを用いて言語・非言語情報の分析を行うことで,関係性の段階による対話戦略の違いを明らかにした.
|
研究成果の学術的意義や社会的意義 |
当初の目的である健康状態の推定には至らなかったものの,雑音重畳や統計的音声合成によりデータ増強を行うことでユーザ状態推定の頑健性を向上できることを示した.この手法は音声感情認識だけでなく,様々なユーザ状態推定に応用可能であるため,音声を用いたアプリケーションの多くで有用である.また,識別器の改善により音声感情認識自体も人間による判断に匹敵する性能が得られることを示した.加えて,対話型アプリケーションが継続的に使われるための言語/非言語的ふるまいの変化に関して,包括的な対話制御モデルを構築するための手がかりとなる結果を得た.
|