研究概要 |
自然音声の合成は音声応答システムや発声代行システムの開発において重要な研究課題である.発声には声帯におけるピッチ制御と声道における調音制御の2つの要素がある.アクセントやイントネーションなど言語の自然性はピッチに由来し,声道(舌,口唇,歯,鼻腔など)の巧妙な調音制御の重要性はいうまでもない.われわれは従来,電極による調音運動計測,音声のPARCOR分析,頚部インピーダンスの計測,MRIによる声道断面計測などを行ってきたが,本研究ではとくに後2者について重点的に解析を進めた. (1)頚部インピーダンスの抵抗,容量成分を分離計測する装置を開発し,ピッチとの間の静特性(非線形特性)を関数近似した.この関数を用いて静特性補正したインピーダンスについて,ピッチ変化との動特性を求め,ピッチ変化を逆推定する手法を開発した.単一母音のついて,推定ピッチより合成した音声は原音声に一致した.連続母音では音韻の変化によるインピーダンス変動分を補正することにより推定できる.なお,ピッチ変化は抵抗変化よりも容量変化として検出できる場合があり,発声法に依存した個人性と考えられる. (2)MRIを用いて口腔,鼻腔を含む声道全容の3次元形状計測を行った.とくに水分含有量が少ない歯冠部形状を撮像するために植物油脂製の薄膜歯冠プレートをかぶせて,口腔,鼻腔を同時に撮像する手法を開発した.この画像より濃度補間法により任意の声道断面形状を推定し,3次元表示する手法を開発した.この方法により左右大臼歯間を0.4mm以内の精度で計測できる.つぎに,5母音と歯擦子音/s/,/sh/,/shu/発音時についての3次元MRI画像よりキュービックコンボリューション法を用いて口腔および鼻腔の任意の断面像を推定した.この結果,歯冠部の位置や副鼻腔の容量に個人差があることが明らかになった.
|