研究概要 |
本研究の目的は,発音・発声障害者の不明瞭な音声を健常者に近い明瞭な音声へ自動変換するシステムを,ソフトコンピューティング技術を用いて開発し,障害者の音声コミュニケーションの手段を確立することである.以下が本年度の研究実績の概要である. (1) 新たな音声特徴量の抽出 スパースコーディングを用いて音声信号の新たな特徴量の抽出を行い,より少ないパラメータで音声を表現することができるようになった. (2) 発音・発声障害者の音声特徴量から健常者の音声特徴量への変換 (1) 変換速度の向上 音声特徴量の変換法として,我々は双子型自己組織化マップを用いた変換法を完成させていたが,本年度は実用化を念頭に,音声特徴量の変換において,入力側で音声分析をせず,双子型自己組織化マップの入力側すべてのユニットに線形部分空間を保持させた双子型部分空間自己組織化マップを新たに提案し,変換速度を従前の1/3に短縮した. (2) 単語認識精度の向上 本年度は,音声特徴量変換の計算量を低減させるため,音声特徴量間の変換マッピングコードブックをニューラルガスネットワーク(NGN)により量子化し,その際,変換精度の低下を抑えるために,クラスごとに構築した局所変換モデルを用いた.その結果,音声変換精度を評価したところ,変換精度の向上が確認されると共に,変換された音声に対して動的計画法(DP)マッチングによる単語認識を行ったところ,従前のモデルに比べて単語認識精度の向上も確認された.
|