2020 Fiscal Year Annual Research Report

Depelopment of high-quality speech analysis-synthesis systems with ability to extract 3D vocal tract shape and vocal cord vibration signal precisely

Research Project

Project/Area Number	17K00253
Research Institution	Meijo University
Principal Investigator	坂野秀樹名城大学, 理工学部, 准教授 (20335003)
Project Period (FY)	2017-04-01 – 2021-03-31
Keywords	3次元声道形状 / 声道断面積関数 / PARCOR分析 / フォルマント / FDTD法 / 機械学習
Outline of Annual Research Achievements	音声信号からPARCOR分析を介して声道形状を推定する手法の改良方法をいくつか検討したが、精度の改善にはつながらないものがほとんどであった。その原因を探るための一方法として、3Dプリンタにより作成した声道模型を用い、その音響特性測定実験によって得られた伝達関数と、1次元FDTD法などのシミュレーション手法によって推定された伝達関数との比較を行った。両者の伝達関数におけるフォルマント周波数の比較により、声道形状が直角に変化する部分を含む場合には、1次元のシミュレーション手法で第4・第5フォルマント周波数で特に大きな誤差が生じることが明らかとなった。一方で、声道形状が滑らかに変化する場合には、誤差が手法によらず比較的小さいことが分かった。音圧分布シミュレーションの結果より、前者の声道形状において直角に変化する部分で発生する球面波の影響であることが示唆された。実際の人間の声道形状では直角に変化することはほとんどないため、PARCOR分析を用いた声道形状推定において精度向上が見られなかった原因の一つは、評価に用いていた声道形状が、直角に変化する部分を含むことであった可能性が高い。これを踏まえ、再実験を行ったところ、推定精度の向上が確認された。また、フォルマント周波数の誤差については、1次元のシミュレーション手法では、高次のフォルマント周波数が高い周波数に推定される方向に誤差が発生することが判明した。高い周波数への誤差は、周波数軸の伸長で近似できるため、伝達関数の周波数軸を伸長する処理を行うことによって推定精度を改善することができる可能性がある。これに基づく声道形状の推定精度の向上手法については今後の課題である。

Research Products
(2 results)

All Presentation (2 results)

[Presentation] 3Dプリンタによる声道モデルの音響特性の計測実験に対する3次元FDTD法を用いた検証2020
- Author(s)
  後藤康泰，坂野秀樹，旭健作
- Organizer
  日本音響学会2020年秋季研究発表会
[Presentation] 3Dプリンタによる声道モデルの音響特性と1次元・3次元のFDTD法による伝達関数の比較検証2020
- Author(s)
  後藤康泰，坂野秀樹，旭健作
- Organizer
  令和二年度電気・電子・情報関係学会東海支部連合大会