本研究では、音声の瞬時的な構造解析法の構築を試みる。その基盤として、自然観測法理論に基づいた波形観測を採用する。その際、瞬時に関する時間スケールは、ピッチ周期程度から、音素知覚程度、単語知覚程度まで、自然観測法理論の観測パラメータを調節することによって変化させ、時間スケールによる動的な特徴の違いを分析する。またEGG波形との比較により発生器官の運動との関連を探る。 平成9年度は、手法の検討及びシミュレーションを行った。時変的性質を考慮した構造解析を可能とするために音声を有限Direchlet級数で表現し、その瞬時的パラメータ(瞬時的な極、瞬時的な零点)の推定法を理論的に考察した。この表現方法および瞬時周波数の推定法を離散時間型の自然観測フィルタを用いて実装したが、その計算速度は十分ではなかった。高速かつ高精度に実装するためには推定法の数値解法について考察する必要がある。ラリンゴグラフを用いて音声波形と同期したEGG波形を収集し分析結果と比較する予定であったが、本年度はEGG波形のサンプルを収集するだけに留まった。 本年度では、本手法を用いれば音声波形の瞬時的特徴(極の瞬時的な周波数や帯域幅)の変化を実現できることが判明したので、この特徴の基礎的な分析及びEGGとの比較による調音器官との関連の調査を予定している。また、次年度に予定されているDSPによる実装・実験のための改良も必要である。
|