研究課題/領域番号 |
25282053
|
研究機関 | 神戸大学 |
研究代表者 |
滝口 哲也 神戸大学, 学内共同利用施設等, 准教授 (40397815)
|
研究分担者 |
有木 康雄 神戸大学, 学内共同利用施設等, 教授 (10135519)
高田 哲 神戸大学, 保健学研究科, 教授 (10216658)
中井 靖 宮崎大学, 教育文化学部, 講師 (80462050)
榎並 直子 神戸大学, 学内共同利用施設等, 助教 (80628925)
中川 誠司 国立研究開発法人産業技術総合研究所, その他部局等, 研究員 (70357614)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 教育工学 |
研究実績の概要 |
脳性麻痺障がい者の発話スタイルは健常者と異なり,その発話内容を理解するのが困難な場合がある.そのような方々の発話理解を目指し,昨年度の研究を継続させながら,本年度以下4つのサブテーマについて研究を遂行した.(I)障がい者の発話のばらつきが大きくなるという課題に対して,多層ニューラルネットワークの一種である,畳み込みニューラルネットワーク(Convolutional neural networks)を用いた発話変動に頑健な音声特徴量抽出法を提案した.210単語認識タスクにおいて,従来のケプストラム特徴量と比較して,約8%(認識率84%から92%)の認識率の改善が得られた.(II)様々な角度から映された顔画像に対して感情認識を行った.具体的には,"Speeded Up Robust Features" (SURF)を改良した新たな特徴量を提案し,有効性を確認した.(III)本年度は,Alternating Direction Method of Multipliers (ADMM)を用いた非負値行列因子分解(NMF)による声質変換を提案し,有効性を示した.昨年度までのNMFによる声質変換では,計算コストが高いという問題があった.提案手法により10倍近くの高速化が実現された.(IV)画像情報を用いた発話認識を行うため,本年度は,唇画像に対してフレーム間の変化を表現可能な唇差分画像及び,畳み込みニューラルネットワークを用いる手法を提案し,その有効性を示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本年度の交付申請書では,研究実績にて報告した通り4つのサブテーマを設定していた.本年度の実績として,(I)障がい者音声の解析に関して,昨年度の確率的音素ラベリング手法と畳み込みニューラルネットワークによる手法を研究開発し,音声認識精度を改善出来ることを示し,学会などで論文発表を行った.(II)顔表情認識においても実動作可能な手法を提案し,学会発表を行った.また,(III)声質変換手法においては,これまで研究代表者らが提案してきた非負値行列因子分解による手法に関して,少量学習データ及び雑音環境下における声質変換の性能を改善し,学会発表を行った.また,(IV)画像情報を用いた発話認識においても,差分特徴量を提案し,その有効性を示すことが出来て,国際会議に論文を投稿中である.多くの成果が得られており,本申請課題は,当初の計画以上に進展しているといえる.
|
今後の研究の推進方策 |
今後は,H27年度の研究を継続しながら,更に,(I)障がい者への体力的負担を軽減するため,音響モデルの事前発話数を削減する方法として,話者適応技術について研究開発する.(II)様々な発話スタイルを制御するため,感情音声の一つとして,怒り声を通常声に変換する手法として,Deep neural networksに基づく手法を研究開発する.(III)障がい者の話者性を維持しながら,聴き取りやすい声を生成する手法として,健常者の声と障がい者の声のハブリッド合成音を研究開発する.(IV)障がいの程度によっては声の生成は困難であるが,顔部位の微小変動が可能な場合がある.顔部位の微小変動から声を生成する技術を研究開発する.
|
次年度使用額が生じた理由 |
H27年度の研究成果について既に国際会議に論文が採択されており(H28年度発表),H28年度の旅費等の一部にあてるため,次年度使用額が発生した.
|
次年度使用額の使用計画 |
予定よりも多くの研究成果が得られており,予定よりも多く成果発表を行うことになる.H28年度分として請求した研究費と合わせて旅費等の一部にあてる予定である.
|