2016 Fiscal Year Annual Research Report
Project/Area Number |
14J04514
|
Research Institution | Kobe University |
Principal Investigator |
相原 龍 神戸大学, システム情報学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2014-04-25 – 2017-03-31
|
Keywords | 声質変換 / 障がい者支援 / 識別学習 / 発話リズム / Duration |
Outline of Annual Research Achievements |
声質変換は,ある話者の声をあたかも別人が発話しているかのように変換する技術である.アテトーゼ型脳性麻痺による構音障がい者の不明瞭な発話を,この声質変換技術を用いて聞き取りやすく変換することが本研究の目標である.声質変換技術はテキスト認識を行わない,音声から音声へ変換するシステムであるため,手足の動きが不自由な発話障がい者にとっても使いやすい技術であると考えられる.本年度は,声質変換精度の向上を目標として,「識別的学習」と「発話リズム変換」の2つのタスクに取り組んだ. 構音障がい者発話が不明瞭になる原因として,音素の曖昧性が指摘されている.音素は音声において分割可能な最小単位とされている.構音障がい者は,口や舌など発話する機構が不自由であるため,健常者と比較して発話が曖昧になりやすい.提案手法では,これまで我々が研究してきた,構音障がい者の声質変換で用いられてきたアルゴリズムに,音素を識別するモデルを導入し,発話が明瞭に変換されるよう改良を加えた.この研究成果は,音声信号処理において世界最大級の国際学会INTERSPEECH2016において発表された. 構音障害がい者の発話の特徴として,発話が不自然に間延びするという点がある.健常者の発話リズムは基本的に一定であるのに対して,障がい者の発話リズムは,その前後の音素の関係や発話者の体調によって大きく変化する.この発話リズムの変動が,障がい者の発話を聞き取りにくくする原因の一つとなっていた.発話リズムの変換はこれまで例が少なく,特に声質変換システムにおいて,発話リズムは入力話者のものをそのまま用いることがほとんどであった.そのため,発話リズムを変換する新たな特徴量を提案し,リズムを健常者に近づけることに成功した.これらの研究成果は日本音響学会ならびに電子情報通信学会で発表され,現在,INTERSPEECH2017に投稿中である.
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Research Products
(13 results)