2008 Fiscal Year Annual Research Report
Project/Area Number |
20500151
|
Research Institution | Yamagata University |
Principal Investigator |
近藤 和弘 Yamagata University, 大学院・理工学研究科, 准教授 (10312753)
|
Keywords | 音声了解度 / 音声認識 / 二者択一型試験 / 客観的推定 |
Research Abstract |
本研究では妨害を含む音声の了解度を、被験者を用いずに計算により予測する方法を提供することを目的とする。本年度は本研究で用いる音声認識システムや音響モデルの枠組みを検討した。 1. 音声認識システムの基本枠組みの検討 まずは本計画で用いる音声認識ベースシステムを検討した。当初はオープンソース大語彙連続音声認識システムであるJuliusの利用を検討したが、このシステムで用いる不特定話者モデルでは性能が不十分であることが判明した。このため学習および適応機能が充実している山形大学のHMNetシステムを用いて、話者適応、および雑音適応モデルを学習することとした。 2. 基本音声認識システムの立ち上げ 二者択一型了解度試験DRT単語対認識用文法を準備し、DRT単語モデルの初期モデルなども用意した。不特定話者モデルを用いて第1次了解度推定を試み、主観評価結果と比較した。単語対文法モデルは十分機能しているが、不特定話者モデルでは雑音のない音声に対しても十分な精度を得られないことを確認した。しかし、雑音量の増加に対応した了解度劣化の傾向は主観評価の傾向と類似しており、モデルの精度が向上すればさらに類似傾向となる感触を得た。 3. 話者および雑音適応モデルの学習 各話者毎に適応したモデル、および混入雑音種毎に適応したモデルを学習した。了解度推定を試み、不特定話者モデルに比べ大幅に性能向上を実現できる見通しを得た。さらに雑音の種類やSN比を混合した最適な学習方法について検討を進める。
|