Research Abstract |
本研究の目的は,2つある.第一の目的は、単位時間あたり最高の効率で日本語音声を聴き取らせる再生速度設定での再生を実現する方法の確立である.第二の目的は,第一の目的のための研究を円滑に行うための特殊な音声データベースを製作し,Webページを用いて一般に公開し,広く全国の研究者の役に立ててもらい,この分野の研究を促進することである. 本年度は,第一の目的を達成するために,昨年より製作してきた再生システムに最終的な修正を加え,鸚鵡返しでの再生もでき,かつ,常に音信号を長し続けるモードでの再生もできるシステムとして完成させた,これによって,話速変化も加味して再生速度を適応的に変化させることの有効性を示すことができた.また,独自に開発して話速推定アルゴリズムが十分実用になることも実証できた. また,本年度は,以上に加えて,第二の目的を達成するために,以下の研究を行った.まず,最も力を入れたのは,音声データベースの完成と公開である.本年度は,昨年度収録した音声に極僅かなエラーがあったため,その修正から作業にとりかかった.修正作業は,音声データベースを少しでも良いものにするために万全を期したものにしたため,そのアルゴリズムは研究としても一定の程度の価値のあるものとなり,平成23年7月に査読付き論文として公表できることとなった.これは,本研究の中では副次的効果ではあるが成果の一部である.その他,音声データベースには,音声だけでなく背景の音楽を付加したものも独自に作成した.また,あらたに話者2名を呼び,1日かけて,4種類の話速での音声採取も行った.さらに,原稿提示システムも改良し公開した.以上により,全国の音声研究者が無料で利用できる「話速バリエーション型音声データベース(SRV-DB)」が完成した.
|