Research Abstract |
脳性麻痺構音障がい者の音声コミュニケーションの実現を目指し,H23年度では,「障がい者音声の解析」において,新たな音声特徴量抽出法,リップリーディングに関する検証を行った.また「ハンズフリー音声認識の解析」において,音源方向推定手法に関する研究を進めた.これらについて以下の3つのサブテーマを設定し研究を行った. 1.非負値行列因子分解による構音障がい者の音声特徴量抽出 構音障がい者の発話変動に頑健な音声特徴量抽出法を提案した.提案手法では,予め構音障がい者の安定した発話のスペクトルを用いて辞書を作成する.その辞書をNMFに適用して,不安定な発話のスペクトルを,辞書に含まれる安定した発話のスペクトル基底のスパースな線形結合(結合係数のほとんどが0)で近似表現し,その結合係数を特徴量として音声認識を行う.音声認識実験の結果,提案手法を用いることで,1回目の不安定発話において従来のMFCC特徴量を用いる場合よりも,10%の認識率の改善がみられた. 2.Active Appearance Model (AAM)による顔方位に対応した発話認識 今年度は,AAMを用いることにより,様々な角度の顔方位を正面に変換して,リップリーディングを行う手法を提案した.提案手法では,顔方向を正面に変換するため,横方向の発話内容を学習する必要がなく,正面での発話を学習するだけで横方向の発話を認識することができる.脳性麻痺構音障がい者の場合,不随意運動により発話時に頭部が動くため,従来手法では,様々な顔方向に対するデータを収録する必要があったが,提案手法により収録データ数を減らすことが出来た. 3.音響伝達特性を用いた未学習位置の推定 限られた位置の音響伝達特性を用いて,音響伝達特性から位置への回帰モデルを学習することで,未学習位置の推定もその音響伝達特性と回帰モデルを用いて行う手法を提案し、有効性を示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
障がい者音声の解析に関しては,機械学習法に基づく新たな音声特徴量抽出法を提案し,従来手法よりも音声認識精度を改善出来ることを示した.更に脳性麻痺構音障がい者のリップリーディングの検討を行い,有効性を示すことが出来た。また,ハンズフリー音声認識に関しては,未知音源位置の推定方法として,音響伝達特性の回帰モデルを提案し,有効性を示すことが出来た.よって,本申請研究は,おおむね順調に進展しているといえる.
|
Strategy for Future Research Activity |
本研究代表者らは,これまで世界に先駆け脳性麻痺障がい者の音声認識の研究開発を進めてきた.今後は更に,新たなコミュニケーション手段の一つとして,(聴き取りの困難な)脳性麻痺構音障がい者の声を聴き取り易い声へ変換する手段が必要である.障がい者からの意見として,出来れば自分自身の声を皆に聴いてもらいたいという要望も存在し,生成される音声は,必ずしも障害者とは全く異なる声質を持った健常者の声にしたい訳ではない.よって障がい者の話者性を保ちながら,聴き取りやすい声に変換する技術の確立が必要である.
|