喉頭摘出患者の食道発声音声、老化や脳性麻痺にともなう不明瞭音声を、発声原理に基づいて明瞭化するフィルタを構成することが本研究の目的である。最終年度は、これら不明瞭音声の特徴抽出、および音声の個人性を保持した明瞭化フィルタの構築をおこなった。更にここで得られた音声の特徴と発声器官の動作の関係をもとに、発声された音声の特徴から口内の動きを推定して提示することにより、発声障碍患者が自律的に発声訓練をおこなえるシステムに関する研究をおこなった。 喉頭発声音声との比較・分析から、食道発声音声については、雑音性が高い、基本周波数が低い、倍音構造が不明瞭、スペクトル包絡が平坦、発声が不安定であるといった特徴がみられた。一方の脳性麻痺患者の音声は、基本周波数が高く(男女共に300〜400Hz)、パワースペクトルのエネルギーが2kHzまでの低域に集中しており、フォルマントが不明瞭かつ独特の共鳴特性を持ち、更に発声が不安定であることがわかった。これらをもとに発声原理に基づいたリアルタイム明瞭化フィルタを構成した。 マイクからの入力音声に対してまず母音/子音の判別を行う。母音であれば基本周波数を抽出し、ピッチを喉頭発声音声の帯域へシフトした上で、櫛形フィルタにより倍音構造を明瞭化する。一方、子音に対しては振幅の増幅をおこなう。更に時間軸上では、子音の立ち上がりおよび母音発声時の定常状態を安定化させるための包絡処理をおこない、出力音声を生成する。 本手法の有効性を調べるため、アンケートによる聴取実験を行った。フィルタリング前後の音声の対を合計12対作成し、ランダムな順でスピーカーから呈示した。成人健聴者に対し、11の評価項目について5段階評価でアンケートに答えてもらった結果、本提案フィルタの有効性が示された。 今後は、基本周波数の高精度抽出と音声の自然性、個人性保持に関する検討を更に進めるとともに、発声障碍音声フィルタリング機器の実用化を目指していく。
|