研究課題/領域番号 |
26330197
|
研究機関 | 九州工業大学 |
研究代表者 |
水町 光徳 九州工業大学, 工学(系)研究科(研究院), 准教授 (90380740)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 断続音声修復 / 知覚的修復 / 連続聴効果 / パケットロス / 実環境適応性 |
研究実績の概要 |
近年のパケット通信量の急増により、パケットロスによる通話音声の時間的断続が問題となっている。数パケットのロスによる瞬断には、国際規格ITU-T G.711 Appendix Iなどのパケットロス隠蔽法が提案されている。しかし、現実には、100 msを超えるバーストロスが頻発しており、根本的に断続音声修復法を再考する必要がある。 本研究では、バーストロスを想定し、受信音声信号の物理的な修復ではなく、受聴者の聴覚機能を積極的に利用した知覚的修復について検討する。聴覚の錯覚現象である連続聴効果を利用し、パケットロスによる欠損区間に何らかの信号を挿入することにより、断続音声を滑らかに知覚させる。本研究では、修復音声の滑らかさの向上と挿入音のうるささの低減を実現する挿入信号について検討を進めている。平成26年度は、調波複合音と環境雑音の混合信号を挿入信号として、それらの時間・周波数特徴について検討した。 平成27年度は、断続音声の知覚的修復法の多面的評価を行った。雑音環境での有効性を検討するために、擬似雑音環境を構築した。防音室内に4つの雑音再生用スピーカを設置し、Head and Torso Simulatorの片耳にスマートフォンを装着して通話音声の収録を行った。使用した雑音は、実環境で収録した駅構内雑音と人混み雑音である。目的音声対雑音比を3 dB~7dBとし、パケットロス長を60 ms~200 msとして、提案法とG.711 Appendix I方式によるパケットロス修復音声の主観評価実験を行った。その結果、すべての条件において、提案法がG.711方式よりも高い評価を得た。演算コストの評価においても、提案法は、G.711方式の30%程度の演算量であることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
平成27年度は、当初の計画には含めていなかった実環境適応性について検討した。その結果、静寂な実験室環境での評価と擬似雑音環境での評価では、主観評価結果の傾向が異なることを確認した。提案法は、周囲に雑音が存在する場合、挿入信号のレベルを小さくしても修復音声の滑らかさを維持でき、なおかつ挿入音のうるささが低減することがわかった。また、背景雑音レベルにより、提案法の挿入信号の最適レベルが異なることも確認した。 主観評価実験の結果より、実環境における提案法の最適化アルゴリズムについても検討した。出力音声の時間遅延を重視する場合は、周囲の騒音の大きさに基づいて挿入信号の大きさを決定することが望ましい。一方、出力音声の多少の時間遅延が許容できる場合は、背景雑音レベルとパケットロス長の両者を考慮して、挿入音レベルを最適化することが望ましい。つまり、アプリケーションに応じて、適応的に断続音声修復法の最適化が可能であることを確認した。
|
今後の研究の推進方策 |
今後は、重畳音声を挿入音とした知覚的修復について検討する。これまでは、挿入音は、有声音を模擬した調波複合音と低周波数帯域でのマスキングを目的とした環境雑音の混合信号として検討を行ってきた。主観評価実験の結果、修復音声の滑らかさ向上と挿入音のうるささ低減の両立が難しいことがわかった。そこで、音声を多数回加算して作成する重畳音声を挿入音として使用することにより、挿入音の違和感を緩和し、挿入音のうるささの低減を目指す。
|
次年度使用額が生じた理由 |
設備備品として聴取実験用にコンピュータの購入を予定していたが、既存のコンピュータで代替が可能であり、実験の実施に支障が生じないことがわかった。従って、平成27年度は、設備備品の購入は行わなかった。また、主観評価実験の実施にあたり、実験参加者への謝金を計上していたが、学内ボランティアの協力により謝金支出が不要となった。
|
次年度使用額の使用計画 |
平成28年度は、本課題の最終年度であるため、積極的に成果発表を行う。また、本研究成果の社会還元を視野に入れて、通信キャリアや携帯電話に関わる企業との意見交換も積極的に行う。
|