研究課題/領域番号 |
26330197
|
研究機関 | 九州工業大学 |
研究代表者 |
水町 光徳 九州工業大学, 工学(系)研究科(研究院), 准教授 (90380740)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 音声修復 / パケットロス / 聴覚の錯覚 |
研究実績の概要 |
スマートフォンの普及により、音声のみならずテキストや画像データも含めた各種パケットの通信料が急激に増加している。これにより、パケットロスにより生じる通話音声の断続が深刻な問題となっている。パケット通信に基づくIP電話(Voice over IP: VoIP)では、国際規格ITU-T G.711 Appendix Iにて、パケットロス隠蔽アルゴリズムが規格化されている。しかし、G.711方式は、最大60 msまでのパケット損失にしか対応できない。 本研究では、聴覚の錯覚現象である連続聴効果を積極的に活用したパケットロス隠蔽アルゴリズムを提案する。連続聴効果は、音声や音楽の一部に損失が生じた場合、その無音区間に本来あるべき信号とは異なる信号を挿入することにより、断続信号が滑らかに知覚できる現象である。連続聴効果が生じるためには、非常に大きなパワーを持つ広帯域信号を使用する必要がある。本研究では、挿入音のうるささを低減し、連続聴効果による断続音声修復を試みた。 平成26年度は、挿入音のうるささを低減し、より滑らか断続音声修復が可能となる挿入音について検討した。まず、周波数領域で、広帯域信号に替わる修復信号として、有声音に見られる調波構造を模擬し、さらに音声の長時間スペクトルにより重み付けを行った高域減衰調波構造音を設計した。更に、低周波数成分を効率的にマスクするため、エアコン動作音を付加した。次に、挿入音の時間変動特性について検討した。通常の音声は、振幅包絡は定常ではなく、パケット単位の短期間観測では滑らかに変化する。そこで、本研究で提案する断続音声修復音にも、振幅包絡の時間変動を施した。 聴取実験により、提案手法の妥当性評価を実施した。その結果、提案法は、G.711方式では対応できない150 msのバーストロス条件においても、断続音声修復が可能であることがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究提案段階での実施計画では、断続音声修復のための挿入信号の設計指針は漠然としていた。平成26年度は、連続聴効果の心理学的な生起条件を整理し、それを満たす信号の設計指針を定め、挿入信号を作成した。また、その挿入音声の妥当性を評価するための実験の手続きを確立した。
|
今後の研究の推進方策 |
現実的な音環境において、提案法で使用する挿入音の最適化ならびに妥当性の検証実験を行う。
|
次年度使用額が生じた理由 |
聴取実験の実施にあたり、他研究テーマにて整備した実験機器の流用が可能となり、新規購入の必要がなくなった。また、聴取実験参加者への謝金を計上していたが、学内ボランティアにより聴取実験が実施できたため、謝金が不要となった。これらにより、次年度使用額が発生した。
|
次年度使用額の使用計画 |
次年度使用額は、主に旅費として使用する予定である。本研究は、聴覚心理、音響信号処理、通信の学際的テーマであるため、各分野の会議へ積極的に参加し、提案法の妥当性について議論する予定である。
|