• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 研究成果報告書

深層学習に基づいた新しい信号処理技術の確立と歌声および楽器音生成への応用

研究課題

  • PDF
研究課題/領域番号 18K11163
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60010:情報学基礎論関連
研究機関名古屋工業大学

研究代表者

大浦 圭一郎  名古屋工業大学, 工学(系)研究科(研究院), 研究員 (20588579)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード信号処理 / ディープラーニング / 歌声合成 / 音声合成 / 楽器音生成
研究成果の概要

歌声および楽器音を対象として,学習対象データの取捨選択方法の検討や,音声波形自体のモデリング手法の検討,楽譜から波形への直接変換が可能なEnd-to-End構造の検討など,従来のデジタル信号処理の枠を超えた音響モデリングの研究を進め,その一部を学術論文としてまとめ,投稿・発表することができた.その中でも,深層学習に基づいて周期・非周期信号からより自然な音声波形を生成する構成は,画像変換の分野で高い性能を示しているCycleGANのサイクル構造を応用するもので,日本音響学会の粟屋潔学術奨励賞や情報処理学会のマイクロソフト情報学研究賞を受賞するなどの成果をあげている.

自由記述の分野

音声合成

研究成果の学術的意義や社会的意義

現状のほとんどの音声関連技術には,従来型のデジタル信号処理理論を基礎としており,従来型のデジタル信号処理理論は音声関連の研究分野では最も根本的な考え方として広く普及しているが,このような変換・処理で取り扱える枠組みの中に制限されていたため,モデル構造に関する過度の制約による性能限界があった.本研究は,このような状況にブレークスルーをもたらすため,近年急速に技術革新が進んでいる深層学習に基づいた音声波形の直接モデル化手法を新たに開拓しようとするものである.

URL: 

公開日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi