研究課題/領域番号 |
19K12058
|
研究機関 | 群馬工業高等専門学校 |
研究代表者 |
川本 真一 群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 話者混合 / 音声モーフィング |
研究実績の概要 |
本研究課題は,二人の音声から抽出した特徴を混ぜることにより作成した音声の中に,混ぜた二人の話者の情報がどのように知覚されるかを実験的に検討するものである.この手段として,音声を特徴量レベルで混合する「音声モーフィング」という技術を利用した.現時点で扱う特徴量としては,主にスペクトル包絡情報の加工に焦点を当てて検討を進めた. 当該年度では主に,音声モーフィングにおけるスペクトル包絡情報を,「フォルマント周波数とその周辺のスペクトル包絡上の特徴点を補完した平滑化スペクトル」と「元のスペクトル包絡と平滑化スペクトルとの差分で表現する差分スペクトル」とに分け,それぞれに独立して音声モーフィングにおける混合重みを設定して加工した音声刺激に対して,どのように話者の情報が知覚されるかについて検討した.2名の話者それぞれの音声及びモーフィング音声を聞かせ聴取印象を回答してもらったところ,使用した単語及び混合比対の一部の条件において,モーフィング音声に元となる2名を感じ取ることができるとの回答を得た.現時点では実験条件が限定的ではあるものの,条件が整えば1つの音声から2名の話者の印象を知覚させることができる音声加工の実現可能性を示唆する結果と考える.一方で条件を検討するほど実験データはまだ十分にそろっている状況とはいえない.今後は,実験結果の信頼性を確認するため,実験に使用するデータの拡充および追加の聴取実験を進めていく予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
現時点では,音声加工の検討及びその結果を用いたモーフィング音声の聴取印象に関する予備検討まではできているが,コロナ禍の影響もあり,聴取実験の被験者確保や実験実施が思うように設定できず,聴取印象に関する評価が十分に進められていない.
|
今後の研究の推進方策 |
引き続き,聴取実験を注意深く積み重ねることで聴取印象の評価を進め,結果の信頼性の確認を進める.
|
次年度使用額が生じた理由 |
コロナ禍により,当初予定していた聴取実験等が思うように進まず,また外部発表についても当初予定とは変更となったため、残額が生じている。 次年度使用額は、聴取実験を進めるための費用、および外部発表のための費用に充てる予定である。
|