研究課題
特別研究員奨励費
声質変換は,ある話者の声をあたかも別人が発話しているかのように変換する技術である.アテトーゼ型脳性麻痺による構音障がい者の不明瞭な発話を,この声質変換技術を用いて聞き取りやすく変換することが本研究の目標である.声質変換技術はテキスト認識を行わない,音声から音声へ変換するシステムであるため,手足の動きが不自由な発話障がい者にとっても使いやすい技術であると考えられる.本年度は,声質変換精度の向上を目標として,「識別的学習」と「発話リズム変換」の2つのタスクに取り組んだ.構音障がい者発話が不明瞭になる原因として,音素の曖昧性が指摘されている.音素は音声において分割可能な最小単位とされている.構音障がい者は,口や舌など発話する機構が不自由であるため,健常者と比較して発話が曖昧になりやすい.提案手法では,これまで我々が研究してきた,構音障がい者の声質変換で用いられてきたアルゴリズムに,音素を識別するモデルを導入し,発話が明瞭に変換されるよう改良を加えた.この研究成果は,音声信号処理において世界最大級の国際学会INTERSPEECH2016において発表された.構音障害がい者の発話の特徴として,発話が不自然に間延びするという点がある.健常者の発話リズムは基本的に一定であるのに対して,障がい者の発話リズムは,その前後の音素の関係や発話者の体調によって大きく変化する.この発話リズムの変動が,障がい者の発話を聞き取りにくくする原因の一つとなっていた.発話リズムの変換はこれまで例が少なく,特に声質変換システムにおいて,発話リズムは入力話者のものをそのまま用いることがほとんどであった.そのため,発話リズムを変換する新たな特徴量を提案し,リズムを健常者に近づけることに成功した.これらの研究成果は日本音響学会ならびに電子情報通信学会で発表され,現在,INTERSPEECH2017に投稿中である.
28年度が最終年度であるため、記入しない。
すべて 2017 2016 2015 2014
すべて 雑誌論文 (10件) (うち査読あり 8件、 オープンアクセス 2件) 学会発表 (34件) (うち国際学会 10件) 図書 (1件)
EEE/ACM Transactions on Audio, Speech, and Language Processing
巻: 24 号: 7 ページ: 1175-1184
10.1109/taslp.2016.2522643
IEEE/ACM Trans. on Audio, Speech, and Language Processing
巻: PP ページ: 1-10
ACM Trans. on Accessible Computing; Special Issue on Speech and Language Processing for AT
巻: 6
IPSJ Trans. on Computer Vision and Applications
巻: 7 ページ: 64-68
EURASIP Journal on Audio, Speech, and Music Processing
巻: 2015:24 号: 1 ページ: 1-9
10.1186/s13636-015-0067-4
巻: 2015:32 号: 1 ページ: 1-9
10.1186/s13636-015-0075-4
Transactions on Accessible Computing
巻: 未定
IEICE Transactions on Information and Systems
巻: E97-D ページ: 1411-1418
電子情報通信学会技術研究報告
巻: 91 ページ: 39-44
40020156739
巻: 114 ページ: 75-80
110009850921