2011 Fiscal Year Annual Research Report
マルチチャンネル最小二乗平均を用いた複数話者の発話に頑健なハンズフリー音声認識
Project/Area Number |
22700169
|
Research Institution | Shizuoka University |
Principal Investigator |
王 龍標 静岡大学, 工学部, 助教 (30510458)
|
Keywords | ハンズフリー音声認識 / ブラインド残響除去 / マルチチャンネルLMS / 一般化スペクトルサブトラクション / missing feature theory |
Research Abstract |
遠隔環境下で音の生成を定式化し、伝送路の伝達特性を自動的に推定し、様々な残響環境に対して頑健な残響除去および残響除去の信頼性を用いる後処理を行い、高精度な残響処理を実現した。また、パワーSSの代わりに,一般化SSを用いたブラインド残響除去法を提案し,パワーSSに基づくブラインド残響除去法に対してエラー率が大幅に削減できた。さらに、実環境(会議室)の残響を含んだ音声を収録し評価に用いた。今までの人工残響音声と同程度のエラー削減率を達成した。具体的には以下の通りである。 (1)一般化SSによる残響除去:先行研究において、任意の指数パラメータを与える一般化SSはパワーSSより効果的な雑音抑圧法であることが示されている。本研究では、一般化SSを用いて後部残響を除去する方法を提案した。一般化SSは残響環境下において、パワーSSと従来法より大幅な性能を改善した。 (2)残響と定常雑音の同時補正:本研究では、加算性雑音も考慮する。加算性雑音が定常雑音の場合、まず、文先頭の無音区間を利用し加算性雑音のスペクトルを推定し、加算性雑音を除去する。次に、上記の方法を用いて残りの残響を補正することによって、二段階で雑音や残響を補正する。 (3)実環境での評価:実環境の残響を含んだマルチチャンネル残響音声を収録し、残響除去法の評価に用いた。実験の結果として,発話単位CMNを利用しただけの場合と比べて,残響除去法を適用することで、使用したチャンネルの組み合わせ全てに対して大きな性能改善が見られた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
交付申請書に記載した「研究の目的」の定常雑音と残響の同時除去を実現して、人工残響音声と実環境で収録した音声を評価した。さらに、交付申請書に予定してない一般化SSを用いて後部残響を除去する方法を提案した。
|
Strategy for Future Research Activity |
実環境における複数音源の残響と雑音の同時補正 各時刻で音源数の自動推定および残響音声の自動検出によって、雑音と複数音源からの残響が同時に存在しても、厳密に定式化するように提案法を拡張する。ある時刻では、ある音源だけから発話していることを仮定すると、音源からマイクロフォンまでの伝達特性が推定できる。本研究では、雑音除去と各時刻で音源数の自動推定によって、残響の特性をブラインド的に推定する。複数の音源からマイクロフォンまでの伝達特性を利用し、提案する残響処理手法により複数音源の残響の補正を同時に行うことができる。
|
Research Products
(13 results)