2009 Fiscal Year Annual Research Report
フレキシブルな時間軸を持つ高効率音声再生法の研究と研究者用音声データベースの作成
Project/Area Number |
20500111
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
高橋 弘太 The University of Electro-Communications, 電気通信学部, 准教授 (10188005)
|
Keywords | 音声データベース / 話速推定 / 効率的視聴 / モーラ / 原稿提示システム / アナウンサー |
Research Abstract |
本年度の研究目標は、(1)アナウンサー肝用原稿提示装置の改良、(2)プロの発話者に朗読を依頼しての集音の第二回を行うこと、(3)収録した音声の公開、(4)収録した音声を用いた実験、であった。 (1)については、こちらで制御したい話速どおりに話者に原稿を読んでもらうことが困難であたっという初年度の知見に基づき、新しい原稿提示法を開発した。それは、あらかじめ当該話者に好みの速度で原稿を読んでもらいそれを解析しモーラ数を算出し、狙った話速での発声を話速変換技術を使って生成し、その人工的な発話を発声前の話者に提示することで、できるだけ正確な話速での発声をうながそうという方法である。このアイデアを実現したことによって、話者に負担をかけることなく、正確な話速での発話を効率よく収録することができるようになった。 (2)については、現役の声優の方2名をお招きして、一日かけて収録を行った。著作権の問題が起こらないよう、オリジナルの原稿をこの研究課題用に作成したので、公開後はさまざまな研究で使ってもらうことができると考えている。話速は、自然話速の他、1秒あたり、4.76モーラ、8.00モーラ、11.31モーラの4つの話速で収録することができ、現在編集中である。 (3)については、現在、http://www.it.ice.uec.ac.jp/SRV-DB/SRV-DB_release.htmlで、SRV-DBというデータベース名で公開している。また、(4)については、本データベースを利用した具体的研究として、話速推定とその結果を用いた最適速度再生システムを開発し、話速研究の重要性と、その研究のために本データベースが有用であることをアピールできたと考えている。
|
Research Products
(3 results)