研究課題/領域番号 |
26280060
|
研究機関 | 名古屋大学 |
研究代表者 |
戸田 智基 名古屋大学, 情報基盤センター, 教授 (90403328)
|
研究分担者 |
亀岡 弘和 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員/特別研究員 (20466402)
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
猿渡 洋 東京大学, 情報理工学(系)研究科, 教授 (30324974)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 機能拡張 / 音声合成 / 音声変換 / 信号処理 / 統計処理 |
研究実績の概要 |
音声コミュニケーションにおいて、物理的・身体的制約により生じる障壁を取り除くために、現存の音声生成過程において併用可能な音声変換基礎技術、および、音声生成機能を拡張する応用技術の構築を目指し、以下の課題に取り組んだ。 1.発声器官動作制御機能を備えた統計的音声変換技術の構築:調音動作操作機能を備えた統計的声質変換技術と、音源生成器官動作操作機能を備えた統計的韻律変換技術を併用することで、発声器官動作制御機能を備えた統計的音声変換技術を構築した。また、音声波形加工に基づく韻律変換手法や、高精度な音声特徴量時系列モデリング手法の改良に取り組んだ。 2.音声生成機能を拡張する複数の応用技術の構築:音声生成機能拡張技術として、発声障碍者補助技術、外国語発声生成技術、体内伝導音声強調技術、ボイスチェンジャー技術を構築し、その性能を評価した。発声障碍者補助技術については、短遅延予測処理に特化した手法を提案し、その有効性を示した。外国語発声生成技術に関しては、日本語話者の英語音声に対して、個人性を保持しつつ自然性を改善する手法を提案した。体内伝導音声強調技術については、統計的体内伝導音声強調処理部の前処理として適したを外部雑音除去技術を考案した。ボイスチェンジャーに関しては、提案技術に基づく変換システムを国際的評価会Voice Conversion Challenge 2016に投稿し、参加17機関中、最高性能の評価を得るに至った。 3.調音動作・音声同期収録データベースの構築:データベースの構築に向けて、前年度までに収録したデータの整備に取り組んだ。 4.これらの研究成果をとりまとめ、国内外において多数の研究発表を行った。本研究成果は高い評価を受け、国内において計4つの賞を受賞するとともに、8件の招待講演を実施するに至った。
|
現在までの達成度 (段落) |
28年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
28年度が最終年度であるため、記入しない。
|
次年度使用額が生じた理由 |
28年度が最終年度であるため、記入しない。
|
次年度使用額の使用計画 |
28年度が最終年度であるため、記入しない。
|