2016 Fiscal Year Annual Research Report
Development of communication support system based on intent recognition for cerebral palsy
Project/Area Number |
25282053
|
Research Institution | Kobe University |
Principal Investigator |
滝口 哲也 神戸大学, 都市安全研究センター, 准教授 (40397815)
|
Co-Investigator(Kenkyū-buntansha) |
有木 康雄 神戸大学, 都市安全研究センター, 名誉教授 (10135519)
高田 哲 神戸大学, 大学院保健学研究科, 教授 (10216658)
中川 誠司 千葉大学, フロンティア医工学センター, 教授 (70357614)
中井 靖 宮崎大学, 教育学部, 准教授 (80462050)
榎並 直子 神戸大学, 大学院システム情報学研究科, 助教 (80628925)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | ヒューマン・インターフェース |
Outline of Annual Research Achievements |
脳性麻痺障がい者の発話スタイルは健常者と異なり,その発話内容を理解するのが困難な場合がある.本研究では,障がい者の自立した社会生活支援に資するコミュニケーション支援機器の開発を目指している.今年度は,下記4つのサブテーマについて研究を遂行した. (I)障がい者の音声認識:話者に依存するパラメータと依存しないパラメータを持つRestricted Boltzmann Machineを用いた音響特徴量抽出法を提案し,構音障がい者の単語発話認識実験により,提案手法の評価を行った.評価実験において,既知話者に対して提案手法の有効性を示した.(II)感情変換:「ストレス度」の少ないコミュニケーションを目指し,怒り声を通常声に変換する手法の研究を遂行した.具体的には,Deep neural networksを用いた声質変換手法を提案し,客観評価実験により有効性を示した.(III)障がい者の音声合成:障害者の話者性を維持しつつ,聴き取りやすい音声を生成する方法の研究を遂行した.具体的には,隠れマルコフモデルに基づく音声合成手法においてスペクトル,ピッチパラメータに関して健常者音声合成モデルと障がい者音声合成モデルの統合手法を提案し,主観聴取評価実験により有効性を示した.(IV)画像情報を用いた発話認識:factored 3-way RBM (Restricted Boltzmann Machine)を用いた音声特徴量と画像特徴量を統合した特徴量抽出法を提案し,音声と唇画像を用いたマルチモーダル音声認識実験により,提案手法の有効性を示した. 上記4つのサブテーマにおいて,各々評価実験を行い従来手法と比較して有効性を確認できたが,今後は更に精度の向上及び学習データを減らした場合について研究を遂行していく.
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Causes of Carryover |
28年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
28年度が最終年度であるため、記入しない。
|
Research Products
(17 results)