研究概要 |
近年,会議や会合における審議事項や発言内容を記録・保存しておくことが,情報活用の観点や証拠書類の保存の要請から求められている。会議室のような広い空間において大勢の参加者が発話する場面では,マイクロホンアレーによる集音が効果的である。しかし,誰が(あるいはどこで)発言した内容が必要になるかは,実際にその情報を利用する段階にならないと定まらない。そこで,本研究では,各マイクロホン入力信号に対して適用する音声信号圧縮処理手法を開発するとともに,それとアレー処理アルゴリズムを組み合わせた広領域音声信号の集音・保存システムを構築した。開発した音声圧縮処理では,音声信号を擬似雑音信号(PN系列)と掛け合わせることで周波数軸上に情報を拡散し,さらにその信号をFFTにより周波数領域に変換した上で別のPN系列を掛けることにより,時間軸上にも情報を拡散する。この段階において,再量子化を行うことによりデータ量を削減する。PN系列の性質上、拡散のときと同じPN系列を掛けることにより逆拡散処理が実現されるが,再量子化により生じた量子化ひずみは,この逆拡散過程において時間周波数空間に一様に拡散されることになる。その結果,逆拡散後の信号は,音声信号に定常的なガウス性の雑音が付加された音となる。この手法の利点は、圧縮処理によるひずみが定常雑音信号になるため,定常信号雑音を対象とした音声強調処理により,雑音を低減できる可能性があることや,聴感上のひずみ感が和らぐ点が挙げられる。また,圧縮処理において聴覚マスキング現象などを利用していないため,高速な圧縮処理が実現できる。計算機シミュレーションおよび実空間における実験の結果,提案した圧縮手法とアレー信号処理の組み合わせにより,ADPCMによるデータ圧縮処理とアレー処理を組み合わせた場合と,同程度の目的音に対するセグメンタルSNRの改善を実現することに成功した。
|