本研究では,調音測定技術,音響測定技術,及び,統計的メディア変換技術を統合することで,音声信号のみから調音器官運動の様子を高精度に推定する手法を検討した。また,研究の遂行に必要なコーパス構築も行った。その結果より詳細には,1)EMA を用いて一人の日中バイリンガル話者を対象に,日中各言語の音声・調音パラレルコーパスを構築した。2)音声からの調音運動推定問題に対して,話者正規化技術を応用して精度向上を実現した。3)音声の構造的表象を用い,当該話者が正確に発音できない音素に対しても,想定される調音運動を推定する技術を構築した。成果はトップカンファレンスにて発表し,雑誌論文にまとめることができた。
|