2009 年度実績報告書

実騒音環境下における発音・発声障害者の音声コミュニケーション手段の確立

研究課題

研究課題/領域番号	19300078
研究機関	山口大学
研究代表者	内野英治山口大学, 大学院・理工学研究科, 教授 (30168710)
研究分担者	末竹規哲山口大学, 大学院・理工学研究科, 准教授 (80334051) 畔津忠博山口県立大学, 情報化推進室, 准教授 (70285451) 久保田良輔宇部工業高等専門学校, 制御情報工学科, 助教 (50432745)
キーワード	音声変換 / ソフトコンピューティング / 自己組織化マップ / 機械学習 / 人工知能
研究概要	本研究の目的は,発音・発声障害者の不明瞭な音声を健常者に近い明瞭な音声へ自動変換するシステムを,ソフトコンピューティング技術を用いて開発し,障害者の音声コミュニケーションの手段を確立することである.以下が本年度の研究実績の概要である. (1) 新たな音声特徴量の抽出スパースコーディングを用いて音声信号の新たな特徴量の抽出を行い,より少ないパラメータで音声を表現することができるようになった. (2) 発音・発声障害者の音声特徴量から健常者の音声特徴量への変換 (1) 変換速度の向上音声特徴量の変換法として,我々は双子型自己組織化マップを用いた変換法を完成させていたが,本年度は実用化を念頭に,音声特徴量の変換において,入力側で音声分析をせず,双子型自己組織化マップの入力側すべてのユニットに線形部分空間を保持させた双子型部分空間自己組織化マップを新たに提案し,変換速度を従前の1/3に短縮した. (2) 単語認識精度の向上本年度は,音声特徴量変換の計算量を低減させるため,音声特徴量間の変換マッピングコードブックをニューラルガスネットワーク(NGN)により量子化し,その際,変換精度の低下を抑えるために,クラスごとに構築した局所変換モデルを用いた.その結果,音声変換精度を評価したところ,変換精度の向上が確認されると共に,変換された音声に対して動的計画法(DP)マッチングによる単語認識を行ったところ,従前のモデルに比べて単語認識精度の向上も確認された.