研究課題/領域番号 |
18K11163
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60010:情報学基礎論関連
|
研究機関 | 名古屋工業大学 |
研究代表者 |
大浦 圭一郎 名古屋工業大学, 工学(系)研究科(研究院), 研究員 (20588579)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2018年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 信号処理 / ディープラーニング / 歌声合成 / 音声合成 / 楽器音生成 / 楽器音合成 |
研究成果の概要 |
歌声および楽器音を対象として,学習対象データの取捨選択方法の検討や,音声波形自体のモデリング手法の検討,楽譜から波形への直接変換が可能なEnd-to-End構造の検討など,従来のデジタル信号処理の枠を超えた音響モデリングの研究を進め,その一部を学術論文としてまとめ,投稿・発表することができた.その中でも,深層学習に基づいて周期・非周期信号からより自然な音声波形を生成する構成は,画像変換の分野で高い性能を示しているCycleGANのサイクル構造を応用するもので,日本音響学会の粟屋潔学術奨励賞や情報処理学会のマイクロソフト情報学研究賞を受賞するなどの成果をあげている.
|
研究成果の学術的意義や社会的意義 |
現状のほとんどの音声関連技術には,従来型のデジタル信号処理理論を基礎としており,従来型のデジタル信号処理理論は音声関連の研究分野では最も根本的な考え方として広く普及しているが,このような変換・処理で取り扱える枠組みの中に制限されていたため,モデル構造に関する過度の制約による性能限界があった.本研究は,このような状況にブレークスルーをもたらすため,近年急速に技術革新が進んでいる深層学習に基づいた音声波形の直接モデル化手法を新たに開拓しようとするものである.
|