研究課題/領域番号 |
26330216
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
佐宗 晃 国立研究開発法人産業技術総合研究所, 知能システム研究部門, 主任研究員 (50318169)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 音声分析 / 音声合成 / AR-HMM / 食道発声音声 / 声質改善 |
研究実績の概要 |
H26年度は、構築したトポロジ自動生成ARHMM分析法を非周期性の強い音源で発声する食道発声音声の合成音声と実際の音声に適用して、提案分析法の有効性を検証した。合成音声を用いた評価では、分析で得られるパラメータの正解が既知であるため、提案法の分析精度評価が容易であった。一方、実音声を用いた評価では分析結果の正解が未知であるため、食道発声の単母音音声(発声中の声道特性がほぼ一定と仮定できる)を用い、得られる声道フィルタ特性の時系列の時間的変動量を算出して評価することで、非定常性の強い音源と声道特性が安定的に分離されることのエビデンスとした。H27年度は、この食道発声音声から提案法により推定した声道特性の音韻性に関する妥当性を検証するために、食道発声音声から推定した声道特性に、健常者音声から提案法により推定した音源を入力して音声を再合成し、その再合成音声を試聴することで、明瞭な音韻性が保存されているかどうかを評価する主観評価を試みた。少量サンプルによる予備実験の結果、音韻性が十分保存されていることを確認した。また、健常者から抽出した音源にいれかえて、再合成することで声質を大幅に改善できる可能性があることも確認した。この予備実験結果を受けて、提案法に基づいて、食道発声音声の声質をリアルタイムで改善する方法についても検討を行った。H26年度に構築した手法は、分析フレーム毎にHMMの学習を繰返すため演算量が膨大であった。そこで、特定話者の音源HMMを予め学習しておき、リアルタイムでの分析時には、その学習済み音源HMMを用いて声道特性パラメータと利得を適応的に推定する分析法を構築した。予備実験によりその有効性を確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
H27年度は所内管理部署への出向のため、十分な研究時間を確保するのが困難であった。
|
今後の研究の推進方策 |
構築したトポロジ自動生成AR-HMM分析法を声帯疾患音声に適用し、得られる音源HMMのネットワークトポロジおよび出力分布に関する確率・統計量から、声帯異常の検知に有効なパラメータの探索を行う。
|
次年度使用額が生じた理由 |
H27年度は所内管理部署への出向のため、研究の進捗がやや遅れたため。
|
次年度使用額の使用計画 |
H28年度は昨年度の遅れを取り戻すべく研究活動の時間を確保し、研究計画に従って研究を実施するとともに適切に予算を使用する。
|