研究概要 |
1.音響処理機構の研究に関して。線形予測分析法の分析次数を変更したときの判別率を破裂子音、鼻子音について求めた。その結果、破裂子音については17次以下では認識率が低くなるが、17次以上に増やしてもあまり改善されない。鼻子音については19次が最適であった。聴覚フィルターモデルをシミュレートするプログラムの開発を行なった。このモデルを用いた子音の判別率について今後実験を行なう予定である。 2.調音事象の自動検出に関して。当初考えていたエキスパートシステムの手法と並行して、ニューラル・ネットによる手法について試み、音声パワーの傾斜係数および、LPCスペクトルを入力とするとき、未学習話者の有声破裂子音に関して/b/および/d/では100%、/g/については92%が±3ms以内の精度で検出できた。 3.弁別的特徴の自動認識への適用に関して。本年度は音響音声変換に弁別素性レベルを導入することについて、新しい素性モデルを提案した。このモデルは、音素、異音、素性、音響パラメータの各レベルを導入する。音響パラメータの有限個のメンバーは階層構造を成し、発話時に生起する代償作用をある程度予測する。素性は複数の音響パラメータの部分集合から成る。人間の聴覚機構の特性に基づいて、素性間に階層構造を設定し、音韻環境によって異音に生起する素性の脱落をある程度予測する。素性は音素ではなく異音と多対多の対応関係にあるとする。 4.音素の特徴の言語間の非核に関して。破裂子音/p,t,k,b,d,g/を対象として破裂の位置や強さ、ホルマント等スペクトログラムから抽出できる音響的特徴について日仏二か国語間で対照を行なった。日本語と対応するフランス語の音節の特徴のほとんどが共通であることが分かった。しかし、日本語で欠落している「チ、ツ、ヂ(ジ)、ヅ(ズ)」に対応した歯茎音/t,d/の特徴の相違は顕著に認められた。
|