本研究では、パケットロスによる断続音声の修復法について検討を行った。現在、国際規格ITU-T G.711 Appendix Iに規定されたパケットロス隠蔽法が用いられているが、この手法は、パケットロスの継続長が60 ms以下を想定している。そこで、本研究では、150 ms程度のバーストロスによる断続音声の修復を実現するために、物理的な音声波形修復ではなく、知覚的な断続音声修復について検討を進めてきた。 提案手法は、バーストロスにより生じた音声の断続部分に、あらかじめ準備した修復信号を挿入し、連続聴効果により断続音声の修復を実現する。平成26年度は知覚的断続音声修復に有効な挿入音について検討し、平成27年度は様々な環境下での提案手法の主観評価を実施した。その結果、修復音声の滑らかさの向上と挿入音のうるささの低減には、検討の余地があることがわかった。したがって、平成28年度は、断続音声修復により効果的な挿入音について再検討した。 平成27年度までは、様々な環境音について、断続音声のための挿入音としての妥当性を検討した。平成28年度は、挿入音の違和感を低減するために、挿入音として重畳音声の利用可能性について検証した。まず、聴取実験を実施し、音声の重畳回数による断続音声修復の有効性について検討した。その結果、音声の重畳回数は、10回から20回程度が最適であることがわかった。次に、重畳音声と被修復音声とのエネルギー比については、環境音を挿入音として用いた場合と同様に、被修復音声対挿入音のエネルギー比が-3 dBの場合が、最も妥当であることがわかった。また、重畳音声の作成に被修復音声の話者の音声を用いることにより、修復音声の滑らかさの評価は変化しないものの、挿入音のうるささを大幅に低減できることがわかった。
|