研究概要 |
音声分析手法の高度化を研究目標として, 音声の音響的特徴と生理的特徴の両側面から研究を行った. 音響的特徴に着目する研究では, 音声の時変的特性の分析と音素特徴の分離・抽出について研究を行った. 音声の時変的特性の分析では, 複合余弦波による新しい分析法を提案した. これは音声波を短い時間窓を用いて周波数分析する手法で, 周波数成分がm個のとき3m個の標本値を用いれば, 成分波の周波数, 振幅, 位相が分析可能となることの数学的根拠を明らかにした. この分析法を音声を含む種々の振動波に適用して, その有効性を確認した. この分析法を用いて音声の時変的特性の分析を進める予定である. 時変的特性をARMA過程におけるパラメータの時変特性の推定によって据えることを目的とする分析法の研究も同時に行なっている. これら2つの手法の性能比較を検討中である. また音素特徴の分離, 抽出に関しては, 音声の群遅延スペクトル特性に基づく平滑化距離尺度を考案し, この距離尺度を用いる単語音声認識実験を行なって, その有効性を調べた. その結果, この距離尺度は雑音や周波数特性の変形などの妨害を受けた音声信号の分析に有効であることが章らかになった. また線形予測残差成分を最小化するように音声信号を分割して, 音素特徴を分離する手法について検討中である. 次に, 生理的特徴に着目する研究では, 口唇近傍の音声器官のモデル化と, 駆動音源特性と声道特性の分離法とについて精細な研究を行なった. 口唇近傍のモデル化では, 種々の口唇形態のレプリカによる音響測定と, 口唇奥の上下門歯の噛み合わせを模擬した音響による測定とによって, 生体の音声放射特性を再現するモデルの定式化を行なった. また駆動音源となる声門波をモデル表示し, 声道特性をARMAモデルで表現することにより, 音源特性と声道特性を精密に分析する手法を考案し, 鼻音の分析などに適用してその有効性を確認した.
|