本研究では、音声対話システムにおける音声認識精度の高精度化と非言語音声情報の積極的な利用を目的として、音声発話中から咳を検出する方法について検討した。 本年度は、まず健常者による咳のデータを収集し、咳波形の音響分析を行った。次に収集した咳波形からHMM音響モデルを構築し、咳を含む音声発話の認識実験を行った。実験の結果、咳HMMによって咳の検出を行うことはできるものの咳挿入エラーが頻出することが確認された。この問題を解決するため、咳波形に特有な高域周波数成分のみをバンドパスフィルターによって抽出し、フィルタリング後の波形からHMMを構築することを試みた。さらに原波形から構築したHMMとフィルタリング後の波形から構築したHMMとの両方を用いて、認識誤りを低減する方法を提案した。 更に、咳の種類を判別するための第一段階として、咳払いの検出方法を検討した。本研究では、咳払いを「口を閉じたままの咳」と定義し、軽度な咳症状の1つと考え、通常の咳と咳払いの判別を行うために、音素パターンにより咳払いを表現する方法を提案し、咳払い検出実験を行った。実験の結果、咳払い波形からHMMを構築して認識を行う方法と比べ、音素パターンで咳払いを近似表現する方法によって高精度に咳払いの検出が可能であることが確認できた。 以上の研究成果を国際会議および国内の研究発表会等で発表した。
|