研究課題/領域番号 |
16J10726
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
知能情報学
|
研究機関 | 名古屋大学 (2017) 奈良先端科学技術大学院大学 (2016) |
研究代表者 |
小林 和弘 名古屋大学, 情報基盤センター, 特別研究員(PD)
|
研究期間 (年度) |
2016-04-22 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
1,900千円 (直接経費: 1,900千円)
2017年度: 900千円 (直接経費: 900千円)
2016年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | 知覚情報 / sprocket / 歌声声質変換 / 歌声声質制御 / 知覚年齢 / 混合正規分布モデル |
研究実績の概要 |
本年度の研究実績の概要は下記のとおりである. [フリーライセンスの声質変換・制御基盤フレームワーク”sprocket”の開発と公開] 統計的声質変換・制御法に関するオープンソースソフトウェアとして,sprocketの開発・公開を実施した.本ソフトウェアに関する解説論文を執筆した.Voice Conversion Challenge2018において,ベースラインシステムとして利用される事が決まっており,今後,幅広い活躍が期待される. [歌声声質変換法に関する論文の執筆と投稿] 差分スペクトル補正に基づく歌声声質変換の研究成果を論文として執筆し,Speech Communication誌へと投稿した. [知覚情報を考慮した統計的声質制御法に関する国際会議論文の執筆] 本研究課題の核となる手法として,統計的声質制御法における,声質制御パラメータの設計法に関する研究成果を国際会議論文にまとめた.本論文は,声質制御を担う声質制御ベクトル空間において,複数の声質制御パラメータの独立性を確保し,よりユーザの知覚に合致した声質制御が実現する手法を提案する論文である.本研究成果は,評価対象として音声を用いて実施しているが,歌声声質制御においても適用可能な枠組みである.今後,歌声声質制御にも適用し,その性能を評価する予定である. [WaveNet vocoderによる声質変換・制御品質の向上] 深層学習を利用した,音声波形生成技術の一つとしてWaveNetがある.本研究では,このWaveNetのネットワークアーキテクチャを応用する枠組みとして,F0,スペクトル包絡情報,非周期性指標を補助特徴量とし,音声波形を生成するWaveNetボコーダを提案した.本提案法により,従来のボコーダの枠組みに比べて,より高い音質を持つ音声波形の生成が可能となった.
|
現在までの達成度 (段落) |
29年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
29年度が最終年度であるため、記入しない。
|