研究課題/領域番号 |
17650045
|
研究機関 | 東京大学 |
研究代表者 |
嵯峨山 茂樹 東京大学, 大学院情報理工学系研究科, 教授 (00303321)
|
研究分担者 |
小野 順貴 東京大学, 大学院情報理工学系研究科, 講師 (80334259)
西本 卓也 東京大学, 大学院情報理工学系研究科, 助手 (80283696)
|
キーワード | マイクロホンアレー / 複素スペクトル円心法 / CSCC法 / 雑音抑圧 / 音声分離 / 非対称性 / 性弦波重畳モデル / 音源定位 |
研究概要 |
カーナビの音声認識、ハンズフリー電話機、会議の録音などにおいて、マイクロホンアレーを用いて雑音を抑圧し目的音声を強調する研究が盛んに行われている。本研究の目的は、このような用途での信号処理において、複素スペクトル平面上での幾何的取り扱いという新しい着想に基づく手法(CSCC法)を確立し、またこの着想を拡大することである。本年度の主な成果は下記の通りである。 1)位相拘束付CSCC法の検討 従来のCSCC法は、観測信号が複素スペクトル平面上で円をなす、ということのみを条件として雑音抑圧を行っていた。しかし等間隔アレイの場合には、どの方向から音源が到来しても、隣接アレイ間の時間差(位相差)は等しいという角度方向の拘束条件を導入することができる。これにより、雑音やモデル化誤差への頑健性を高める手法を検討し、シミュレーションにより、雑音音源が2個以上存在する従来のモデルにない状況でも、頑健な雑音抑圧ができることを確認した。 2)球面非対称2chマイクロホンによる全方向音源定位 球面に非対称に2chのマイクを配置し、アレイ自体がもつ対称性を崩すことで、前後判断を含めた全方向音源定位複素スペクトルは振幅・位相の2つの情報をもつ。このうち、通常無視されがちな位相項を含めた調波信号のモデリングと、EMアルゴリズムを拡張した補助関数法という新たな手法により、1chで混合された音声を分離する新たな手法を創出した。複素スペクトルは振幅・位相の2つの情報をもつ。このうち、通常無視されがちな位相項を含めた調波信号のモデリングと、EMアルゴリズムを拡張した補助関数法という新たな手法により、1chで混合された音声を分離する新たな手法を創出した。で行う新しいシステムを構築した。音源定位可能性の考察は、両チャネル間伝達関数の複素軌跡に着目することにより行っている。 3)正弦波重畳モデルに基づく1ch音源分離 複素スペクトルは振幅・位相の2つの情報をもつ。このうち、通常無視されがちな位相項を含めた調波信号のモデリングと、EMアルゴリズムを拡張した補助関数法という新たな手法により、1chで混合された音声を分離する新たな手法を創出した。
|