2016 Fiscal Year Annual Research Report
Perceptual restoration of intermittent speech relying on illusory continuity
Project/Area Number |
26330197
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
水町 光徳 九州工業大学, 大学院工学研究院, 准教授 (90380740)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 断続音声修復 / 知覚的修復 / 連続聴効果 / パケットロス / 実環境適応性 |
Outline of Annual Research Achievements |
本研究では、パケットロスによる断続音声の修復法について検討を行った。現在、国際規格ITU-T G.711 Appendix Iに規定されたパケットロス隠蔽法が用いられているが、この手法は、パケットロスの継続長が60 ms以下を想定している。そこで、本研究では、150 ms程度のバーストロスによる断続音声の修復を実現するために、物理的な音声波形修復ではなく、知覚的な断続音声修復について検討を進めてきた。 提案手法は、バーストロスにより生じた音声の断続部分に、あらかじめ準備した修復信号を挿入し、連続聴効果により断続音声の修復を実現する。平成26年度は知覚的断続音声修復に有効な挿入音について検討し、平成27年度は様々な環境下での提案手法の主観評価を実施した。その結果、修復音声の滑らかさの向上と挿入音のうるささの低減には、検討の余地があることがわかった。したがって、平成28年度は、断続音声修復により効果的な挿入音について再検討した。 平成27年度までは、様々な環境音について、断続音声のための挿入音としての妥当性を検討した。平成28年度は、挿入音の違和感を低減するために、挿入音として重畳音声の利用可能性について検証した。まず、聴取実験を実施し、音声の重畳回数による断続音声修復の有効性について検討した。その結果、音声の重畳回数は、10回から20回程度が最適であることがわかった。次に、重畳音声と被修復音声とのエネルギー比については、環境音を挿入音として用いた場合と同様に、被修復音声対挿入音のエネルギー比が-3 dBの場合が、最も妥当であることがわかった。また、重畳音声の作成に被修復音声の話者の音声を用いることにより、修復音声の滑らかさの評価は変化しないものの、挿入音のうるささを大幅に低減できることがわかった。
|
Research Products
(1 results)