2020 Fiscal Year Annual Research Report
Depelopment of high-quality speech analysis-synthesis systems with ability to extract 3D vocal tract shape and vocal cord vibration signal precisely
Project/Area Number |
17K00253
|
Research Institution | Meijo University |
Principal Investigator |
坂野 秀樹 名城大学, 理工学部, 准教授 (20335003)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 3次元声道形状 / 声道断面積関数 / PARCOR分析 / フォルマント / FDTD法 / 機械学習 |
Outline of Annual Research Achievements |
音声信号からPARCOR分析を介して声道形状を推定する手法の改良方法をいくつか検討したが、精度の改善にはつながらないものがほとんどであった。その原因を探るための一方法として、3Dプリンタにより作成した声道模型を用い、その音響特性測定実験によって得られた伝達関数と、1次元FDTD法などのシミュレーション手法によって推定された伝達関数との比較を行った。両者の伝達関数におけるフォルマント周波数の比較により、声道形状が直角に変化する部分を含む場合には、1次元のシミュレーション手法で第4・第5フォルマント周波数で特に大きな誤差が生じることが明らかとなった。一方で、声道形状が滑らかに変化する場合には、誤差が手法によらず比較的小さいことが分かった。音圧分布シミュレーションの結果より、前者の声道形状において直角に変化する部分で発生する球面波の影響であることが示唆された。実際の人間の声道形状では直角に変化することはほとんどないため、PARCOR分析を用いた声道形状推定において精度向上が見られなかった原因の一つは、評価に用いていた声道形状が、直角に変化する部分を含むことであった可能性が高い。これを踏まえ、再実験を行ったところ、推定精度の向上が確認された。また、フォルマント周波数の誤差については、1次元のシミュレーション手法では、高次のフォルマント周波数が高い周波数に推定される方向に誤差が発生することが判明した。高い周波数への誤差は、周波数軸の伸長で近似できるため、伝達関数の周波数軸を伸長する処理を行うことによって推定精度を改善することができる可能性がある。これに基づく声道形状の推定精度の向上手法については今後の課題である。
|
Research Products
(2 results)