1996 Fiscal Year Annual Research Report
Project/Area Number |
07650506
|
Research Institution | Kumamoto University |
Principal Investigator |
園田 頼信 熊本大学, 工学部, 教授 (70037836)
|
Co-Investigator(Kenkyū-buntansha) |
緒方 公一 熊本大学, 大学院・自然科学研究科, 助手 (10264277)
|
Keywords | MR像 / 声道形状 / 音声合成 / 画像処理 / 声道シミュレータ |
Research Abstract |
本研究は,主に(1)MR(磁気共鳴)画像による声道の3次元形状の推定,及び(2)音声信号からの声道形状の推定,の2項目について研究を実施した.このうち本年度では,(2)の音声信号からの声道形状の推定について重点的に行なった.これは,ヒトの音声生成過程を模擬した声道シミュレータを計算機上に構築し,「合成による分析(A-b-S)」法を用いて,発話時の声道形状を推定するものである. 声道シミュレータの開発は,本研究では重要な課題であり,ここでは損失の挿入が容易な周波数域・時間域の混成であるハイブリッド系を用いた.このシミュレータは,声帯音源(時間域),声道(周波数域)および口唇放射(周波数域)の3つの部分から構成されている.声道部は,長さは等しいが断面積が異なる20個の円筒形を縦続接続したモデルで表した. MR画像から推定した形状(断面積)を20個の円筒形に対応させて日本語5母音の合成実験を行なった.その結果,母音/a/と/o/の第1フォルマント周波数がそれぞれ約120Hz,70Hzと実音声のそれより低めに見積った.また/i/の第4フォルマントは900Hz程度高めの値を示したが,その他の母音では5%以内の誤差で良好な近似を示した. 次に,実音声信号および適当な声道断面積を与えた声道シミュレータの合成音の,それぞれのスペクトルを比較し,誤差が最小になるように声道シミュレータの断面積を調整することで,声道形状を推定する実験を行なった.その結果,/a/,/u/および/e/の第1フォルマント周波数は8〜9%の誤差を示したが,それ以外の母音あるいはフォルマント周波数は3%以内の値を示し,実音声と合成音声では良好なスペクトルの一致を見た.
|
-
[Publications] Keisuke Mori: "Relationship between Lip shapes and acoustical characteristics during speech" Proceedings of 3rd Joint meeting of ASA and ASJ. 879-882 (1996)
-
[Publications] Kohichi Ogata: "Development of articulatory measuring system by using magnetometer and optical sensors" Proceedings of 3rd Joint meeting of ASA and ASJ. 889-894 (1996)