研究課題/領域番号 |
19K12058
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 群馬工業高等専門学校 |
研究代表者 |
川本 真一 群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 話者混合 / 音声モーフィング |
研究開始時の研究の概要 |
本研究課題では,「二人の声の特徴を部分的に混ぜ合わせての1つの声を作り出したとき,混ぜ合わせた元の話者の特徴が感じられるようにすることはできるか?」という問いに対して,実験を通じて検討を進める.これにより,ある話者の声の特徴や印象を残しつつ,一部の特徴を別話者の声に近づける方略について模索する.
|
研究実績の概要 |
本研究課題は,二人の音声から抽出した特徴を混ぜることにより作成した音声の中に,混ぜた二人の話者の情報がどのように知覚されるかを実験的に検討するものである.この手段として,音声を特徴量レベルで混合する「音声モーフィング」という技術を利用した.現時点で扱う特徴量としては,主にスペクトル包絡情報の加工に焦点をあてて検討を進めた. 本研究課題では特に,音声モーフィングにおけるスペクトル包絡情報を,「フォルマント周波数とその周辺のスペクトル包絡上の特徴点を補間した平滑化スペクトル」と「元のスペクトル包絡と平滑化スペクトルとの差分で表現する差分スペクトル」とに分け,それぞれに独立して音声モーフィングにおける混合重みを設定して加工した音声刺激に対して,どのように話者の情報が知覚されるかについて検討を進めている. 当該年度では主に,一方の話者の音声スペクトルと,2話者のスペクトルを混合したスペクトルとのスペクトル歪み量が同程度となるような複数の混合条件下において,2名の話者それぞれの音声及びモーフィング音声を聞かせ聴取印象を回答してもらう実験を行い,実験条件の検討を行った.なお現時点では明確な規則性が確認できるデータを得るには至っていない. 今後は,実験結果の信頼性確保に向けて,実験に使用するデータの拡充および追加の聴取実験を進めていく予定である.特に,評価用音声の収録に加え,発話時の映像も同期収録し,評価に加えることを検討する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
現時点では,音声加工の検討及びその結果を用いたモーフィング音声の聴取印象に関する予備検討まではできているが,実験協力者の確保や実験実施が思うように設定できず,評価が十分に進められていない.
|
今後の研究の推進方策 |
引き続き,実験を注意深く積み重ねることで評価データの収集を進め,結果の分析を進める.
|