2023 Fiscal Year Research-status Report
音声を中心とした2話者混在メディア加工手法に関する実験的検討
Project/Area Number |
19K12058
|
Research Institution | Gunma National College of Technology |
Principal Investigator |
川本 真一 群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)
|
Project Period (FY) |
2019-04-01 – 2025-03-31
|
Keywords | 話者混合 / 音声モーフィング / 話者性 |
Outline of Annual Research Achievements |
本研究課題は,二人の音声から抽出した特徴を混ぜることにより作成した音声の中に,混ぜた二人の話者の情報がどのように知覚されるかを実験的に検討するものである.この手段として,音声を特徴量レベルで混合する「音声モーフィング」という技術を利用した.現時点で扱う特徴量としては,主にスペクトル包絡情報の加工に焦点を当てて検討を進めた. 本研究課題では特に,音声モーフィングにおけるスペクトル包絡情報を,「フォルマント周波数とその周辺のスペクトル包絡上の特徴点を補間した平滑化スペクトル」と「元のスペクトル包絡と平滑化スペクトルとの差分で表現する差分スペクトル」とに分け,それぞれに独立して音声モーフィングにおける混合重みを設定して加工した音声刺激に対して,どのように話者の情報が知覚されるかについて検討を進めている. 当該年度では主に,スペクトル歪み量を基準として2話者のスペクトルを混合する複数の混合条件下での刺激音声合成を試みた。しかし、刺激数や混合話者の組み合わせ数などの条件を考慮したとき、現時点では現実的な規模での実験を設計するに至っていない。一方で、並行して本研究課題で扱う個人を知覚する情報から着想を得て、個人差を検知するための知見の収集及び応用の検討も始めている。 今後は,実験結果の信頼性確保に向けて,実験に使用するデータの拡充および追加の聴取実験を進めていくことと並行して、本研究テーマの扱う話題の周辺分野への応用・拡張についても検討を進める予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
現時点では,音声加工の検討及びその結果を用いたモーフィング音声の聴取印象に関する予備検討まではできているが,実験協力者の確保や実験実施が思うように設定できず,評価が十分に進められていない.
|
Strategy for Future Research Activity |
引き続き,実験を注意深く積み重ねることで評価データの収集を進め,結果の分析を進めることと並行して、本研究テーマの扱う話題の周辺分野への応用・拡張についても検討を進める.
|
Causes of Carryover |
当該年度に予定していた実験がやや遅れていることにより、実験・データ収集および成果発表・調査等にかかる予算の執行が少なくなった。これらについては、次年度の実験・データ収集と成果発表・調査およびデータの整理等による支出を予定している。
|