研究概要 |
これまで我々は声道形状と音響特性及び聴覚知覚との関係を解明するため、MR画像から声道形状を計測する方法を開発した。MR画像から成人男性、女性3名、子供1名の日本語5母音発声の声道形状及び声道の各部分の寸法を計測し、年齢・性別による声道形状の違いと音響特徴の関係について調べた。その結果、声道の解剖学上の違いは音響的に影響が小さいことを明らかにした。 本研究ではMR画像(Magnetic Resonance Image)により計測した男性、女性の声道形状の個人性を検討し、声道形状の各部分の違いが音響的な影響及び知覚とに関係について検討する。母音の類似性に関する聴覚実験の結果から、性別による音響特徴の違いは主に声道長に依存することが分かった。同じ音質の母音を発声する時の声道形状と音響特徴を比較した結果、成人男性は調音的近似(相似性)よりも音響的パラメータ(聴覚的に重要であるF1,F2,F3)を「不変量」として発声している示唆が得られた。また、高次フォルマント(F4,F5)は声道の変動に対してロバストな個人性特徴であることを示した。 音声信号から個人性特徴を安定に推定するために、我々は音声生成過程に近い音源・声道モデルを導入し、「部分空間法」による音源・声道の同時推定音声分析法を提案した。実験の結果、本方法は高精度で高次フォルマントまで安定に推定できることを示した。 本課題の研究成果は話者認識研究のほかに、音声合成・声質変換・音声認識・符号化などの研究にも幅広く利用できると期待されている。
|