2022 年度研究成果報告書

対面コミュニケーションと同等に感情を伝えるための音声強調処理法の開発

研究課題

PDF

研究課題/領域番号	19K20618
研究種目	若手研究
配分区分	基金
審査区分	小区分90010:デザイン学関連
研究機関	電気通信大学
研究代表者	岸田拓也電気通信大学, 大学院情報理工学研究科, 研究員 (80827907)
研究期間 (年度)	2019-04-01 – 2023-03-31
キーワード	音声信号処理 / 機械学習 / 声質変換 / 感情音声変換
研究成果の概要	音声符号化技術と通信技術を利用した音声のみによるコミュニケーションでは、視覚情報等の利用ができないために、感情・意図・態度・個人性などの非言語情報を正確に伝えることが困難となる。本研究では、非言語情報と音声の音響特徴量との関係をモデル化できるようなニューラルネットワークを考案し、音声の非言語情報における個人性や感情をを変換・強調する手法について検討した。ボルツマンマシンやその関連手法を利用して、モデルの学習に用いていない話者間で個人性の変換が可能な手法や、個人性と感情を同時に変換する手法、声質を因子に分解して因子の操作によって声質の印象を変換する手法などを提案することができた。
自由記述の分野	音声信号処理
研究成果の学術的意義や社会的意義	本研究で得られた実験結果は、ボルツマンマシンやその関連手法が音声の音響特徴量と非言語情報との関係を表現するのに有効であることを示している。また、画像生成分野で目覚ましい成功を挙げている拡散確率モデルを声質変換課題に適用することに関する研究成果や調査結果は、音声コミュニケーションで声質変換技術をより柔軟に利用するための新たな手法の着想や知見につながった。