2014 Fiscal Year Annual Research Report
Project/Area Number |
14J04514
|
Research Institution | Kobe University |
Principal Investigator |
相原 龍 神戸大学, 都市安全研究センター, 特別研究員(DC1)
|
Project Period (FY) |
2014-04-25 – 2017-03-31
|
Keywords | 声質変換 / 発話支援 / 障がい者福祉 |
Outline of Annual Research Achievements |
本研究では,全国に34万人いるとされる言語・聴覚障がい者のなかでも,アテトーゼ型脳性麻痺による構音障がい者のための音声変換システムを研究対象としている.アテトーゼ現象は,脳性麻痺の症状のひとつであり,意図した動作に緊張状態を発生させる.そのため,アテトーゼ型脳性麻痺患者の多くは,手足が不自由であるとともに発話も不明瞭になってしまい,コミュニケーションが円滑にできないという障がいを抱えている.しかしながらアテトーゼ型脳性麻痺は知的障がいを伴うことがほとんどなく,円滑なコミュニケーションさえ可能になれば,社会進出できると考えられる. そこで申請者は,アテトーゼ型構音障がい者が手話や筆談に頼れないため,彼らの音声を健常者と違和感なく談話できるようにする声質変換技術を研究している.障がい者の不明瞭な発話音声を聞き取りやすい音声に変換することで,構音障がい者とのコミュニケーションが円滑化され,彼らの雇用機会の増加・社会貢献が可能になると考えられる.また,構音障がいは,脳性麻痺患者のみならず,健常者であっても高齢による発話機能低下によっても起る場合がある.提案技術は,少子高齢化の進む日本において,高齢者とのコミュニケーション支援にもつながる技術である. 平成25年度まで,我々は非負値行列因子分解(Non-negative Matrix Factorization : NMF)を用いた声質変換を構音障害者へと応用してきた.本年度は,本研究で用いるNMF声質変換そのものの精度向上・計算時間削減を目指して研究を進め,従来手法に対して1/30の計算時間での変換を可能にした.また,これまで声質変換で問題とされてきた,必要な学習データ量の削減に取り組み,入力話者の音声を学習せずとも変換できる多対一声質変換を健常者声質変換で実現した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
1年目である本年度は,NMF声質変換の精度向上・計算コスト削減を研究目標とした.まず,構音障がい者のためのNMF声質変換の精度を向上させるため,音素カテゴリ辞書選択を導入した.これまで障がい者のあいまいな発話は,複数の音素辞書で変換されてしまう例が報告されており,精度が劣化する事例があった.音素カテゴリ辞書の導入によりこの問題の解決が可能となり,音声の自然性か向上した.この研究は障がい者のための支援技術を研究する国際ワークショップで口頭発表を行い,さらに国際ジャーナルACM Transactions on Accessible Computingへの採録が決定している. また,障がい者のみならず,健常者も対象としたNMF声質変換の精度向上をめざし,アクティビティマッピングNMFを提案した.この手法は入力話者と変換話者の間の基底係数のずれを解消する手法であり,変換音声の自然性が確認された.本研究はIEEEが主催する世界最大規模の国際会議ICASSP2015で発表を行った. NMF声質変換の計算コスト削減のため,2つの提案を行った.一つは辞書学習の導入である.変換に必要な辞書の規模を削減するため辞書の再学習を導入し,従来手法に対して1/30の計算時間での変換を可能にした.二つ目はNMFのアルゴリズム改良である.辞書のなかから必要な要素のみを順に選んでくる新しいアルゴリズムを声質変換に応用し,計算コストの大幅な削減が可能になった.これらの研究は,環太平洋地域を代表する信号処理の国際会議APSIPA2014で発表を行い,国際ジャーナルIEICE Transactions on Information and Systemsへ採録された. 以上,平成26年度は2件の国内発表,3件の国際発表,2件の和文技術報告,2件の国際ジャーナルへの投稿を行い,当初の計画以上の進展が見られた.
|
Strategy for Future Research Activity |
平成27年度は,NMF声質変換をアテトーゼ型脳性麻痺による構音障がい者に特化させることを目標に研究を進める.これまで,声質変換においては入力話者と出力話者のペアになった大量の発話データを必要とした.この制約は,利用者にとって大きな負担になるため,声質変換の実用化の高いハードルとなっていた.平成27年度は障がい者声質変換に応用可能なNMF声質変換において,入力話者と出力話者の発話データを必要としない,多対多声質変換の研究を行う.多数の参照話者の発話データを用いて,入力話者音声を話者特有の成分と音韻特有の成分に分解する.話者成分のみを変換することで,声質変換が可能になると考えられる.この手法を障がい者に応用することで,障がい者の声を所望の声質に変換可能になると考えられる. 構音障がい者にはその障がいの程度によって発話しやすい音素・しにくい音素が存在する.すなわち,障がい者はそれぞれが固有の音素体系を持っていると考えられる.これまでは,健常者の音素体系に従って,音素辞書を構築してきたが,この手法では障がい者固有の音素体系に対応できない.障がい者声質変換のさらなる精度向上のためには,音素体系の自動獲得が必要になる.本研究で用いてきたNMFはクラスタリング手法でもある.そこで,変換に最も適切なクラスタをNMFの基底空間上で行うことで,変換と音素クラスタリングを同時に行うことができると考えている.
|
Research Products
(18 results)