2007 Fiscal Year Annual Research Report
長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究
Project/Area Number |
19700172
|
Research Institution | The University of Tokushima |
Principal Investigator |
柘植 覚 The University of Tokushima, 大学院・ソシオテクノサイエンス研究部, 講師 (00325250)
|
Keywords | 音声認識 / 特定話者 / 音声変動 |
Research Abstract |
本研究では、特定話者ならば長期間に渡り、安定した高精度の音声認識ができる音声認識手法の確立を目標としている。申請期間である平成19年度において、特定話者の音声変動を調査するため、複数の特定話者(男性3名)の音声を収録した。音声収録は毎週1日、1日内で3回(朝、昼、夕方)行った。発声者には、音声収録ごとに環境情報として気温、室温など、発声者情報として気分などのアンケートの記入をしてもらった。 また、これらのデータを研究で使用するために、データベース処理を行った。この作業は発声ごとに音声データを切り出し、各発声を試聴し問題がないかの確認、各ファイルへの発声内容付与や、音素単位のラベリングなどを行った。これらのデータベース処理の作業効率を改善するため、研究の一環とし、データベース処理の効率化を図るためデータベース処理支援ツールの開発を行った。この支援ツールにより、データベース処理にかかる時間が大幅に短縮できることを確認した。 また、特定話者の高精度な音声認識をめざすため、複数の音響モデルから得られる音声認識結果を統合し、音声認識を行う手法を提案した。この提案手法により、1つの音響モデルを用い音声認識を行う場合と比較して、高精度に音声認識ができることがわかった。
|
Research Products
(6 results)