本研究では、音声の瞬時的な構造解析法の構築を試みている。その基盤として、自然観測法理論に基づいた波形観測を採用している。この際、瞬時に関する時間スケールは、ピッチ周波数程度から、音素知覚程度、単語知覚程度まで、自然観測法理論の観測パラメータを調節することによって変化させ、動的な特徴の時間スケールによるの違いを分析する。またEGG波形との比較により発声器官の運動との関連を探ろうとしている. 平成9年度までに、音声波形の瞬時的特徴として瞬時的な極の推定法を提案し、それによる音声波形の分析結果として時間的に変動する極の様子を可視化できることを確かめた。本年度は、本手法の高速算法の検討、音声データの収集、DSPへの実装等を予定していた。本手法の高速算法に関しては、基本観測値系列を求めるためのフィルタ群を自己回帰的に構成すると共に一度計算された値を利用するように構成することによって高速化及び記憶容量の削減を実現した。その後に実行される逆行列演算等に高速化の余地が残っているが、これに関する有効な方策を打ち出すまでには至らなかった。また、大規模な検証実験を行なうために音声データの収集し、5人程度の単独発話母音を得ることができた。本分析法をDSPへ実装しデータ分析を行なう予定であったが、高速算法に関する残された上記の問題をクリアする必要があり、実装までは至らなかった。本提案手法の有効性、信頼性を検証するためには継続して取り組むべき課題の一つである。
|