研究概要 |
超分節的特徴である,音声の基本周波数の変化,音声の継続時間の変化および言語情報などを観測,検討して,それらを音声対話システムで利用する方法を研究した.主な研究の成果は下記のようなものである. 1.超分節的特徴を利用して,連続音声の句境界を抽出する方法を検討してきた.これまでは,振幅情報の変化を中心に句境界候補を見つけていたので,不必要な境界候補が多くでて,それが認識率の低下,処理速度の低下の原因になっていた.今年度は,基本周波数の大まかな変化を中心に句境界候補を探す手法を導入した結果,脱落を増やすことなく,境界の候補を約半分に減少できている. 2.隣接する句間の修飾関係の有無を判定する手法を開発した.パラメータとして,基本周波数の変化,句間の無音部の長さを利用して,しきい値を定めて判別する方法で,連続音声中の隣接句間の修飾関係の約70%を正しく判定できている. 3.声道模擬による合成音声の必要な部分を,違和感なく強調できる手法を開発した.この方法では,基本周波数の変化,振幅の変化,継続時間長を制御する規則を作り,それを合成する音声に合わせて使用している。この手法の導入により,応答音声に適切な変化を付けられるようになった. 4.韻律情報と言語情報を併用して曖昧な構文を解析できる手法を考察した. 5.音声波形の微分,積分を繰り返し,基本周波数を高速に,正確に抽出できる手法を考案し,その基本周波数から,アクセント成分とフレーズ成分を抜き出す手法を検討した.予備実験では成果が得られているので,来年度は実際のシステムに導入する予定である.
|