研究概要 |
特定の音響信号を強調する技術は,日常生活での様々な機器の性能を向上させると期待されている。しかし,大規模なシステムにおいては性能を向上させつつあるが,我々の日常生活で利用できる高性能なヒューマンインターフェースを構築するにはアルゴリズムの複雑さや実装コストなど様々な面での課題が残されている。我々は,高度なヒューマンインターフェースを実現するために,高い空間分解能を有する複数音源信号の強調手法について検討した。本報告では,素子数が少数および多数の両者についてアルゴリズムを開発した。少素子数の場合として,補聴システムを視野にいれた周波数領域両耳聴モデルによる信号分離を,また,多素子数による信号分離としてコンピュータユーザー向けのシステムを検討した。さらには,各々アルゴリズムを検証するに当って,クラスタ計算機を導入し効率化を図った。 ・2素子:[周波数領域両耳聴モデル] このモデルは,物体による音波の回折現象を利用している。回折により生じる両耳間レベル差,位相差に基づき音源の方向および音源信号の強調を行っている。本アルゴリズムの特徴は,従来,仰角の推定には4素子以上が必要であったが,2素子で実現できているところにある。また,演算量も少ないため,ラップトップコンピュータで実時間による音源信号強調が可能となった。身軽に利用できる両耳聴補聴器として利用可能であるか検討を進めている。 ・多素子:[ブランド信号処理および適応ノッチフィルタによる信号分離] 本モデルは,コンピュータユーザーが利用することを想定し,ディスプレイの周囲に8素子を取りつけた。複数話者に対応するために,前処理としてAMUSE法に基づくブラインド信号処理を行い,複数の音源方向推定および追従を可能とした。さらには,複数の適応ノッチフィルタを並列して用いることにより複数の話者信号を同時に強調することが可能となった。 上記のように,次世代のヒューマンフェースの基礎となるアルゴリズムの構築を行い,その検証を行った。特に,前者の周波数領域両耳聴モデルは,二入力で,かつ演算量が少ないので安価なDSPなどでの実現が期待できる。今後は,両耳での聴取を可能とする新しい補聴器として発展することが特に期待でき,実用化に向けアルゴリズムの改善および実環境における検証を行う必要がある。
|