Research Abstract |
前年度では,電気音声の基本周波数情報を得るために呼気センサーを用いたが,この呼気センサーは,話者にかかる負担が高いことが分かった. そこで,電気音声の基本周波数情報を得ることができ,かつ話者に負担をかけない信号として,発声に関与する筋肉上の皮膚に電極を接着し,発声時の電位を計測して得られる表面筋電(EMG)信号に注目した.EMG信号を採取する際には,気管孔を密閉しないので,話者への負担は低減すると期待される.さらに,電極の接着位置を考察することで,基本周波数に相当する情報が得られないかと考えた.ただし,EMG信号単独では基本周波数情報が得られないため,EMG信号から基本周波数が推定する必要があるが,その推定性能は未知であるため,検証した. 研究を進める過程で,これまで用いてきた混合正規分布だけでは,有声・無声の判定が困難であることがわかった.この有声・無声の判定は,二値分類の問題であるということに着想を得て,有声・無声の判断を識別モデルの1つであるサポートベクターマシンで行い,混合正規分布では表面筋電信号と基本周波数の有声部分のみの関係を学習するようにシステムを修正した.3人の話者データを用いて評価した結果,ある話者で84%以上の性能で有声・無声が正しく判定でき,かつ推定基本周波数と目標とした基本周波数間の相関が0.49となる結果を得た.本年度では,表面筋電信号に関して優れた知見を有しているカールスルーエ工科大学(ドイツ)のTanja Schultz教授の下で約1年間滞在して研究を行った.この長期滞在は,表面筋電信号に関する知見を習得するだけではなく,語学能力の向上などの効果もあった.
|