2006 Fiscal Year Annual Research Report
文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発
Project/Area Number |
17700181
|
Research Institution | Shizuoka University |
Principal Investigator |
甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)
|
Keywords | 発話検証法 / 音声認識性能 / 発話様式 / 韻律特徴 / 単語アクセント / 話し言葉 / 統計モデル / 音声理解 |
Research Abstract |
本年度の研究では,目的の一つである多角的・部分的な知識モデルを用いた照合に基づく発話の曖昧さの要因の定量化と発話検証法を開発するため,おもにその基礎データの収集・分析を行った. 1.単語アクセントの違いが音響特徴の統計的モデルによる音声認識性能へ与える影響の分析 昨年度までに,連続音声認識においてキーワード単位の検証としてアクセントモデルを用いる方法を検討している.今年度は,単語単位に注目し,音素表記が同じでアクセントが異なる語を対象として,アクセント特徴を考慮していないMFCC特徴量の統計的モデル(HMM)において音声認識性能へ与える影響を分析した.結果として,有意に認識精度へ影響を与え得ること,特に母音において影響が顕著であることが示された. 2.話し言葉における単語発話の多様性の定量化に関する分析 話し言葉には話者や発話様式の違いが読み上げ音声の場合よりも顕著に現れるものと考えられる.そこで話し言葉の音声資料として多数話者講演音声コーパスを使用し,複数の話者で共通して高頻度で発話されている単語に注目して,その音響特徴の変化を分析した.これまでに,昨年度までの研究に引き続いて音響モデル間の距離に基づく音響特徴パターンの変化の定量化の実験データ収集を進め,認識誤り易さとの相関関係を観測した. 3.単語固有の誤り易さを考慮した発話検証法の開発 昨年度までの研究において,音響モデルの知識から単語の認識誤り率の推定を行ったため,今年度はその結果を利用して信頼度を用いた発話検証の性能を改善する試みを行った.発話された単語のおおよその誤り易さの度合いを事前に知ることができるという理想条件下で発話検証性能を改善した.今後は誤り易さの度合いを認識結果から推定することで同様に改善可能か確認する予定である.
|