1997 Fiscal Year Annual Research Report
発声の音響理論に基づく話者認識のためのロバストな個人性特徴抽出に関する研究
Project/Area Number |
08650420
|
Research Institution | Utsunomiya University |
Principal Investigator |
楊 長盛 宇都宮大学, 工学部, 助手 (80272219)
|
Co-Investigator(Kenkyū-buntansha) |
粕谷 秀樹 宇都宮大学, 工学部, 教授 (20006240)
|
Keywords | MR画像 / 正道形状 / 正道長 / 個人性 / 声道特徴 / 音源特徴 / 音源・声道モデル / 部分空間法 |
Research Abstract |
これまで我々は声道形状と音響特性及び聴覚知覚との関係を解明するため、MR画像から声道形状を計測する方法を開発した。MR画像から成人男性、女性各3名、子供1名の日本語5母音発声の声道形状及び声道の各部分の寸法を計測し、年齢・性別による声道形状の違いと音響特徴の関係について調べた。その結果、声道の解剖学上の違いは音響的に影響が小さいことを明らかにした。 本研究ではMR画像(Magnetic Resonance Image)により計測した男性、女性の声道形状の個人性を検討し、声道形状の各部分の違いが音響的な影響及び知覚との関係について検討する。母音の類似性に関する聴覚実験の結果から、性別による音響特徴の違いは主に声道長に依存することが分かった。同じ音質の母音を発声する時の声道形状と音響特徴を比較した結果、成人男性は調音的近似(相似性)よりも音響的パラメータ(聴覚的に重要であるF1,F2,F3)を「不変量」として発声している示唆が得られた。また、高次フォルマント(F4,F5)は声道の変動に対してロバストな個人性特徴であることを示した。 音声信号から個人性特徴を安定に推定するために、我々は音声生成過程に近い音源・声道モデルを導入し、「部分空間法」による音源・声道の同時推定音声分析法を提案した。実験の結果、本方法は高精度で高次フォルマントまで安定に推定できることを示した。 本課題の研究成果は話者認識研究のほかに、音声合成・声質変換・音声認識・符号化などの研究にも幅広く利用できると期待されている。
|
-
[Publications] C.S.Yang and H.Kasuya: "Automatic estimation of formant and voice source parameters using a subspace based algorithm" Proceeding of IEEE International Conference on Acoustics,Speech,and Signal Processing. (印刷中). (1998)
-
[Publications] 楊長盛、粕谷秀樹: "部分空間法を用いた有声子音の極・零の推定に関する検討" 日本音響学会平成10年度春季研究発表会講演論文集. I. 283-284 (1998)
-
[Publications] 楊長盛、粕谷秀樹: "部分空間法を用いた音源・声道パラメータの推定法" 日本音響学会平成9年度秋季研究発表会講演論文集. I. 291-292 (1997)
-
[Publications] C.S.Yang and H.Kasuya: "Invariance and individuality of the vowel:evidence from articulatory and acoustic observations" Technical Report of the Institute of Electronics,Information and Communication Engineers. SP96-120. 43-48 (1997)
-
[Publications] 楊長盛、粕谷秀樹: "母音の不変性と個人性" 日本音響学会平成9年度春季研究発表会講演論文集. I. 259-260 (1997)
-
[Publications] C.S.Yang and H.Kasuya: "Speaker individualities of vocal tract shapes of Japanese vowels measured by magnetic resonance images" Proceeding of International Conference on Spoken Language Processing. 2. 949-952 (1996)