研究概要 |
本研究では,人間の持つ非常に高度な適応・学習能力を積極的に活用した,人を音声認識器に適応させることで高度な認識精度の実現を可能にする手法の検討を行った.実利用環境における認識精度の劣化を招く主な原因として,想定話者の発話の特徴と実際の話者のミスマッチ(話者要因)が挙げられる.本研究では,話者要因に関して,入力音声の音響的特徴からより適切な発話様式を誘導するための手法の提案と,その効果の検証実験を行った.また,より適切な話者誘導を実現するために必要な,語彙依存な指示語の必要性について調査を行った.音声認識技術のエキスパートによる指示例の収集とその分析を行い,より間違えやすい語に対する適切な指示語生成を可能にするエキスパートシステムを開発した.被験者実験を行い,その効果の検証を行った.
|