研究概要 |
本研究では,書き言葉の音声認識と比較し,認識が困難と考えられる話し言葉音声認識の性能向上を目指す.本研究では研究課題として,(1)音響・言語モデルの高性能化,(2)システム統合,(3)話者インデキシング,の 3点について重点的に取り組む.音響モデルの高精度化に関して離散分布モデルの識別学習,話者クラスモデル,quinphone,残響クラスモデルなどについて検討を行った.システム統合については,連続と離散分布モデルの統合.多種のquinphoneの統合,残響クラスモデルの統合について検討し有効性を示した.言語モデルに関してはクロス適応やクロスバリデーション適応の有効性を示した.さらに話者適応時に必要となる話者ベクトルを用いた話者インデキシングの性能向上について検討した.
|