2004 Fiscal Year Annual Research Report
医療・福祉機器向けの砂時計型ニューラルネットワークを用いた新しい音声合成手法
Project/Area Number |
15500069
|
Research Institution | National University Corporation Tottori University |
Principal Investigator |
清水 忠昭 国立大学法人鳥取大学, 工学部, 助教授 (80196518)
|
Co-Investigator(Kenkyū-buntansha) |
井須 尚紀 国立大学法人三重大学, 工学部, 助教授 (50221073)
|
Keywords | 音声合成 / 砂時計ニューラルネットワーク / LSPパラメータ / 日本語母音 / 主観評価 |
Research Abstract |
日本語における規則音声合成技術は1970年代から熱心に研究されてきたが,高品質な合成音声をめざして音声合成システムの規模は拡大を続け,膨大な計算機資源を必要とするようになった。しかし,医療・福祉機器や,カーナビゲーション装置など,音声による情報伝達を必要とするが,そのために多くの計算機資源をさくことができない応用は現在でも多数存在する。これらの応用向けに,高品質な合成音声を小さなシステムで提供できる手法の研究を行った。 提案する手法では,砂時計型ニューラルネットワークを用いて,音声の特徴を抽出した新たな音声合成パラメータを生成する。本年度は,昨年度の研究に続き,提案手法による日本語母音の再現性の詳細な評価を行った。 昨年度,国際学会(AROB 9^<th> '04)で発表した主観評価実験について,より詳細な主観評価実験を実行するとともに,本手法と主成分分析を用いる手法についての比較も行った。これにより,本手法が主成分分析を用いるよりも優れており,本手法で再現された母音音声が正しく聞き取ることができる品質であることを示した。 これらの結果は,神経回路学会誌(Vol.11,No.4,2004)及び,情報処理学会誌(Vol.46,No.3,2005)で発表した。
|
Research Products
(2 results)