研究課題/領域番号 |
15J10727
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
田中 宏 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2015-04-24 – 2017-03-31
|
キーワード | 喉頭摘出者 / 音声合成 / 電気式人工喉頭 / 基本周波数 |
研究実績の概要 |
本年度の研究業績として、査読付き国際会議2件、国内会議4件である。 構築したシステムは、入力される無喉頭音声(電気音声)から実時間予測される韻律情報(F0パターン)に応じて電気式人工喉頭を直接制御する,実験的な実機システムを構築した.評価実験より,従来の電気音声と比較して,大幅な自然性の改善を確認した. 本研究は,従来のシステムである音声を収録し変換処理をかけること(ソフトウェア)で音質を改善しようとする枠組みではなく,補助器具自体(ハードウェア)を本質的に改良するという新しい取り組みである. 喉頭摘出者の口から抑揚のある音声を生成可能な,対面会話においても使用可能な音声合成技術を確立する.喉頭摘出者は初めて日常的に音声合成技術の恩恵を受けることができるようになる. また,さらなる予測精度改善を目指し,物理モデルを考慮した包括的な統計モデルを構築した. F0パターンは声帯に張力を与える甲状軟骨の運動によって生み出されており,その制御機構の確率モデルが提案されている.従来の確率モデルと述べた物理モデルを考慮した確率モデルをProduct-of-Experts(PoE) の枠組により統合することで,F0パターンの物理的な生成過程の制約を考慮した上で,電気音声の特徴量系列に対応するF0パターンの予測を可能とする統計的F0予測法を提案した.実験的評価より,提案法により,F0予測精度および強調電気音声の自然性の改善を確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
・音声データの収集およびフィードバックの獲得 複数のユーザの使用により,音声データの収集を行った.また、本データを効率的に用いることにより,更なる技術の改良を行った.更に,実際の喉頭摘出者に使用してもらい、フィードバックを得た. ・音声生成過程の物理的なメカニズムを考慮した提案法の改善 提案手法及びそれを搭載した電気式人工喉頭の変換精度を向上させた.その際に,収集した音声データを用いて改善を行った.
|
今後の研究の推進方策 |
・システムの統合及び提案手法搭載電気式人工喉頭の実験的導入 実際のユーザーによる提案法電気式人工喉頭の使用,提案手法の変換モデルの自動学習・自動更新を付与し,喉頭摘出による発声障害者のための実用的かつ高品質な音声合成システムを確立する. ・提案手法の実用化および他の手法の模索 小型デバイスとして携帯性の高い実機を目指す.また,1 年目で考案した手法の弱点を改良し、更なる精度の向上を目指す.その際にも,音源情報は推定しなければいけないので,今までの研究で培った技術・データは生きてくる.さらに優れた発声障害者補助の形を模索する.
|