研究課題
本年度の研究実績の概要は下記のとおりである.[フリーライセンスの声質変換・制御基盤フレームワーク”sprocket”の開発と公開] 統計的声質変換・制御法に関するオープンソースソフトウェアとして,sprocketの開発・公開を実施した.本ソフトウェアに関する解説論文を執筆した.Voice Conversion Challenge2018において,ベースラインシステムとして利用される事が決まっており,今後,幅広い活躍が期待される.[歌声声質変換法に関する論文の執筆と投稿] 差分スペクトル補正に基づく歌声声質変換の研究成果を論文として執筆し,Speech Communication誌へと投稿した.[知覚情報を考慮した統計的声質制御法に関する国際会議論文の執筆] 本研究課題の核となる手法として,統計的声質制御法における,声質制御パラメータの設計法に関する研究成果を国際会議論文にまとめた.本論文は,声質制御を担う声質制御ベクトル空間において,複数の声質制御パラメータの独立性を確保し,よりユーザの知覚に合致した声質制御が実現する手法を提案する論文である.本研究成果は,評価対象として音声を用いて実施しているが,歌声声質制御においても適用可能な枠組みである.今後,歌声声質制御にも適用し,その性能を評価する予定である.[WaveNet vocoderによる声質変換・制御品質の向上] 深層学習を利用した,音声波形生成技術の一つとしてWaveNetがある.本研究では,このWaveNetのネットワークアーキテクチャを応用する枠組みとして,F0,スペクトル包絡情報,非周期性指標を補助特徴量とし,音声波形を生成するWaveNetボコーダを提案した.本提案法により,従来のボコーダの枠組みに比べて,より高い音質を持つ音声波形の生成が可能となった.
29年度が最終年度であるため、記入しない。
すべて 2018 2017 その他
すべて 雑誌論文 (2件) (うち国際共著 2件、 査読あり 2件) 学会発表 (3件) (うち国際学会 3件) 備考 (2件)
Speech Communication
巻: 99 ページ: 211-220
IEEE Transactions on Audio, Speech and Language Processing
巻: 25 ページ: 2337-2350,
https://www.toda.is.i.nagoya-u.ac.jp/publications_FY2017.html
https://scholar.google.co.jp/citations?user=c-AwXZQAAAAJ&hl=ja