フォルマント理論を凌駕する音声知覚モデルを構築するために、平成19年度はまず母音の音響分析を行った。音声生成の理論では、母音は言語に依らず二次元で特徴付けられる。第一は、調音における舌と口蓋の間隔の広さであり、広母音/狭母音の対立軸に対応する。第二は、発話時の舌の前後位置であり、前舌/後舌母音の対立軸に対応する。これらの調音パラメータは、母音の音響的共振ピーク周波数(フォルマント周波数)と密接に関係していることが知られている。本研究では、成人男女4名が発話した連続母音(500発話)を収集し、研究代表者らの独自技術である局所変化率符号化を用いて音響的特徴量を分析した。その結果、母音のスペクトル全体形状に単純な重みベクトルを畳み込むによって発話時の調音パラメータが精度良く推定できることが明らかになった。この手法は、話者や環境に合わせて細かい調整が必要なフォルマント検出と比ベてロバストであること、またフォルマント理論では説明できなかったCenter of Gravityやフォルマント抑圧母音知覚などの現象と整合性が高いことから、従来のモデルを包含した統一的な音声知覚モデルの基礎となる可能性がある。研究代表者は、2007年9月に19th International Congress on Acousticsにおいて、この調音パラメータ推定手法を発表し、Young Scientist Conference Attendance Grantを獲得した。また、この手法を開発する途上で得られた高品質の話速変換手法については、電子情報通信学会の応用音響研究会において発表している(2008年3月)。
|