本年度の研究では,口形極点に基づく連続黙声母音認識に関して,認識用パラメータの抽出方法および認識手法の工夫で認識精度向上を試みた.パラメータとしては,口唇の縦横幅を扱う口形値の他,我々が提案するウェーブレット重心とウェーブレットRMSとを用いた場合が最も良好であったものの,1位正解率は6割台にとどまった.また,本年度の研究において,収集した黙声単子音の特徴分析を進めたものの,個々の子音を明確に識別できるまでの特徴は得られなかった.しかし,各チャネルのウェーブレット重心がピークを迎えるタイミングには特徴が見受けられたため,ピーク位置の前後関係に基づいて黙声単子音をクラスタに分類することを試みた.結果は,有効性は認められるものの十分とは言い難いというものだったが,パラメータとして使用するピーク位置の前後関係は絞る必要があり,すべての前後関係を含めても結果を悪化させるだけであるという知見を得た. 本課題は,発声中も連続的に緩やかに口唇形状が変化し続ける自然な発声を対象である.発声の推移中は特徴も中途半端であり,そのような状況を区別なく扱うと認識が難しくなることは自明である.そのため,本課題の補助期間においては,緩やかに変化する発声過程の中で,特徴を抽出する基準位置を検出する手法を提案した.その一つは発声変化位置であり,もう一つは上述の口形極点である.両者を組み合わせての認識は今後の課題となったが,個別には1位正解率6割台である.少数単語世界での認識の研究も行い,複数音から構成される単語は8割台の1位正解率を得たが,単音からなる語については5割強の1位正解率にとどまった.本年度の成果も踏まえて考えると,発声に依存して変化するはずの各チャネルの重要度を均等に扱って認識を行っていることが,認識精度を伸び悩ませている原因の一つと予想する.これを踏まえた認識手法の改良が今後の課題である.
|