研究課題
脳性麻痺障がい者の発話スタイルは健常者と異なり,その発話内容を理解するのが困難な場合がある.本研究では,障がい者の自立した社会生活支援に資するコミュニケーション支援機器の開発を目指している.今年度は,下記4つのサブテーマについて研究を遂行した.(I)障がい者の音声認識:話者に依存するパラメータと依存しないパラメータを持つRestricted Boltzmann Machineを用いた音響特徴量抽出法を提案し,構音障がい者の単語発話認識実験により,提案手法の評価を行った.評価実験において,既知話者に対して提案手法の有効性を示した.(II)感情変換:「ストレス度」の少ないコミュニケーションを目指し,怒り声を通常声に変換する手法の研究を遂行した.具体的には,Deep neural networksを用いた声質変換手法を提案し,客観評価実験により有効性を示した.(III)障がい者の音声合成:障害者の話者性を維持しつつ,聴き取りやすい音声を生成する方法の研究を遂行した.具体的には,隠れマルコフモデルに基づく音声合成手法においてスペクトル,ピッチパラメータに関して健常者音声合成モデルと障がい者音声合成モデルの統合手法を提案し,主観聴取評価実験により有効性を示した.(IV)画像情報を用いた発話認識:factored 3-way RBM (Restricted Boltzmann Machine)を用いた音声特徴量と画像特徴量を統合した特徴量抽出法を提案し,音声と唇画像を用いたマルチモーダル音声認識実験により,提案手法の有効性を示した.上記4つのサブテーマにおいて,各々評価実験を行い従来手法と比較して有効性を確認できたが,今後は更に精度の向上及び学習データを減らした場合について研究を遂行していく.
28年度が最終年度であるため、記入しない。
すべて 2017 2016
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (15件) (うち国際学会 7件)
American Journal of Signal Processing
巻: 6 ページ: 19-23
10.5923/j.ajsp.20160601.03
EURASIP Journal on Image and Video Processing
巻: 2016(1) ページ: 1-13
10.1186/s13640-016-0140-7