2010 Fiscal Year Annual Research Report
脳性麻痺構音障がい者の発話スタイルの解析及びハンズフリーコミュニケーションの研究
Project/Area Number |
21680054
|
Research Institution | Kobe University |
Principal Investigator |
滝口 哲也 神戸大学, 自然科学系先端融合研究環都市安全研究センター, 准教授 (40397815)
|
Keywords | 音声認識 / 脳性麻痺 / 構音障がい |
Research Abstract |
脳性麻痺構音障がい者の音声コミュニケーションの実現を目指し,H22年度では,「障がい者音声の解析」において,新たな音声特徴量抽出法,及び音響モデル構築手法による効果に関する検証を行った.また「ハンズフリー音声認識の解析」において,音源方向推定手法に関する研究を進めた.これらについて以下の3つのサブテーマを設定し研究を行った. 1.Multiple Kernel Learningによる構音障がい者の音声特徴量評価 構音障がい者の音素認識をSVM(Support Vector Machine)による音声特徴量の識別によって行った.その際,音声特徴量であるMFCC(Mel-Frequency Cepstral Coefficients)の次元毎にカーネル関数を設定し,MKL(Multiple Kernel Learning)による重み付け統合を行う方法を提案し,音声認識に対する各特徴次元の有効性を示した. 2.Buried Markov Modelを用いた構音障がい者の音声認識の検討 現在の音声認識システムでは,Hidden Markov Model (HMM)が音響モデルとして広く用いられている.HMMは隠れ状態と観測のみからなる単純な構造の確率モデルであり,各フレームは独立であるという仮定がある.はっきりと発話された音声に対しては高い精度で認識を行うことができるが,我々の研究結果より構音障がい者のような明瞭度が低い発話を表現するには適していない事が分かった.そこで,H22年度において,HMMの独立性の仮定を緩和することでその表現能力を高めたモデルであるBuried Markov Modelを構音障がい者の音声認識に適用し,その有効性を示した. 3.ハンズフリー音声認識のための音源方向推定の研究 MKL(Multiple Kernel Learning)により,音響伝達特性MFCCの次元重みを発話者位置毎に学習する手法を提案した.提案手法では,SVMのカーネル関数をMFCCの次元毎に定義してそれぞれ独立に計算する.そしてMKLによって次元毎のカーネルの重みを学習して統合し,SVMで識別を行う.H22年度ではAdaBoostによる特徴次元重み学習との比較を行い,提案手法の有意性を示した.
|
Research Products
(12 results)