Project/Area Number |
01608007
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | Kogakuin University |
Principal Investigator |
齋藤 収三 工学院大学, 工学部, 教授 (50126067)
|
Co-Investigator(Kenkyū-buntansha) |
溜渕 一博 工学院大学, 工学部, 講師 (40133326)
小泉 卓也 福井大学, 工学部, 教授 (80020204)
三木 信弘 北海道大学, 応用電気研究所, 助教授 (30002314)
板倉 文忠 名古屋大学, 工学部, 教授 (30168299)
|
Project Period (FY) |
1989
|
Project Status |
Completed (Fiscal Year 1989)
|
Budget Amount *help |
¥14,000,000 (Direct Cost: ¥14,000,000)
Fiscal Year 1989: ¥14,000,000 (Direct Cost: ¥14,000,000)
|
Keywords | 音声分析 / 音響的特徴パラメータ / 生理的特徴パラメータ / 複合余弦波分析 / 郡遅延スペクトル分析 / 口腔内部音圧 / 声門インピーダンス |
Research Abstract |
音声分析手法の高度化を研究目標として、音声の音響的ならびに生理的特徴パラメータに関する研究を行なった。音響的特徴パラメータの研究として、複合余弦波分析法と群遅延スペクトル分析法を考案し、これらを音声信号に適用してその有効性を調べた。すなわち複合余弦波分析法について音声分析のためのアルゴリズムを改善するとともに、単語音声の時間変動特性における発話者内、および発話者間の特徴を分離して分析する方法を考案した。また音声の基本周波数における時間変動特性の細かな分析を行なって、これが合成音声品質に及ぼす影響を調べた。 群遅延スペクトル分析法に関しては群遅延パラメータを適当な帯域幅で平滑化したパラメータによる単語音声認識実験を行い、帯域分割法と分割数、平滑化係数などの最適条件の決定を行なった。また平滑化郡遅延スペクトルパラメータの量子化による情報量の圧縮と単語認識率との関係を調べた。その結果音声信号を1フレームあたり22ビットで符号化して表わせば良好な単語認識が可能であるとの見通しを得た。また音声スペクトルの時間的変化を補問するのに有効な積分スペクトル逆関数を考案し、これが従来の補間法に比して優れていることを示した。 生理的特徴パラメータの研究として、口腔レプリカによる口腔内部の複素音圧分布の測定、有限要素法による声門の非定常流体解析、声門体積流の精密推定を行なった。口腔内部音圧分布の観測により2kHz以下では平面波と見なせるが、それ以上の周波数で舌先付近の音圧に変動が現われること、6kHzでは位相回転が現われることを明らかにした。また声門モデルでの非定常粘性流れの解析を行なって、そのパターンが極めて複雑であることを明らかするとともに、声門の等価インダクタンスおよび等価抵抗の推定を行なった。また病変声帯の声門体積流の推定に基づく声帯ポリープの物理的定数の推定法を導いた。
|