研究概要 |
対話環境における柔軟な音声理解を実現するために,キーフレーズの検出と検証の組合せに基づくアプローチを研究した。キーフレーズには意味タグが付与されており、その検出が直接的に頑健な理解を実現する。検出の湧き出し誤りを抑制するために、サブワードベースの発話検証手法を導入する。これは、認識結果に信頼度を付与するものである。信頼度を定義するいくつかの関数について比較・検討を行った。複数の音声対話タスクのフィールドデータに適用した結果、本手法が、(1)定型的な発話に対して精度を維持した上で、(2)非定型な発話に対する理解率を向上し、(3)タスク外発話の棄却率も改善することが示された。 さらに、頑健なキーフレーズの検出・検証のために、タスクに独立なフィラーモデルの構成法について研究した。本モデルは、タスク固有の語彙を前提とするかわりに、会話のスタイルに依存したフレーズを抽出するものであり、類似の異なった(大規模)コーパスから学習することが可能である。情報検索対話スタイル依存モデルをATISコーパスを用いて学習し、異なった情報検索タスクの音声理解におけるフィラーモデルとして利用することで、認識精度が向上することを示した。
|