研究課題/領域番号 |
17K00258
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
佐宗 晃 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究グループ長 (50318169)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 音声分析 / 声質改善 / AR-HMM / 食道発声音声 |
研究実績の概要 |
音声は最も重要なコミュニケーション手段であり、高齢者のみならず人が充実した社会生活を送るために欠かせない要素である。しかし、喉頭がんの進行により喉頭全摘手術を余儀なくされ、自分の声を失う高齢者は少なくない。不幸にして喉頭全摘出となった場合、電気式喉頭や、ゲップを音源とする食道発声法などの代替発声法が利用されるが、習得が困難で、明瞭性や自然性が大幅に劣化する。本研究課題では、食道発声音声から直接観測できないゲップ音源と声道特性とを高精度に分離し、喉頭全摘出前に収録した自分の音声から推定した声帯音源と入れ替えて音声を再合成することで、もとの声質に近い発声を可能にする声質改善装置の研究開発を目的とする。 昨年度、食道発声音声から声道特性とゲップ音源を高精度に分離・推定するために、実軸上の極の発生を抑圧する制約条件を課したAR-HMM分析法を構築した。しかしこの分析法は、声道特性を表すAR係数だけでなく、ゲップ音源を表すHMMを繰返し学習するため、分析に多くの時間を要しリアルタイム処理には不向きであった。H30年度は、リアルタイムでの声質改善を実現するために、制約条件付きAR-HMM分析法の計算量の削減を試みた。具体的には、昨年度開発のAR-HMM分析を用いてオフラインで特定話者の食道発声音声から音源HMMを学習する。そして声質改善する際には、特定話者であればゲップ音源の確率統計的な特性は不変であると仮定して、学習済み音源HMMを継続使用し、声道特性を表すAR係数だけを制約条件のもと適応的に推定する音声分析法を構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では、食道発声音声から直接観測できないゲップ音源と声道特性とを高精度に分離し、喉頭全摘出前に収録した自分の音声から推定した声帯音源と入れ替えて音声を再合成することで、もとの声質に近い発声を可能にする声質改善装置の研究開発を目的とする。このアプローチにおいて、食道発声音声の声質を劣化させている主原因のゲップ音源を除去するために、音声分析において如何に高精度に声道特性とゲップ音源を分離できるかが重要となる。H30年度は、制約条件付きAR-HMM分析のリアルタイム処理の実現に目途をつけることができ、目標に向かって着実に進捗できていると考えている。
|
今後の研究の推進方策 |
当初計画していたように声道特性と音源を線形分離したソースフィルタモデルに基づいて、音源入替えによる声質改善を試みる場合、音声本来の生成過程と線形分離ソースフィルタの生成モデルとのミスマッチにより合成時に若干不自然な音声が生成される可能性が残されている。一方、近年、DNNなどを用いて声道特性に関する特徴量から音声波形を直接合成する手法が開発され、線形分離ソースフィルタの生成モデルよりも、より自然な音声が合成可能であると報告されている。今後は、制約条件付きAR-HMM分析により得られた声道特性の特徴量を、喉頭摘出前の音声から学習したDNNに基づく音声合成法に提供することで、喉頭摘出前の自分の音声に変換する声質改善装置の開発を行う予定である。
|
次年度使用額が生じた理由 |
研究補助として1名分の人件費を計上していたが、H30年度の途中から研究所が人件費を負担するRAとしての雇用に切り替え、他に研究補助としての適当な人材が見当たらなかったために、次年度使用額が生じた。
|