2004 Fiscal Year Annual Research Report
Project/Area Number |
15360203
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
島田 正治 長岡技術科学大学, 工学部, 教授 (20262462)
|
Co-Investigator(Kenkyū-buntansha) |
矢野 昌平 長岡工業高等専門学校, 電気工学科, 助手 (90332006)
|
Keywords | 独立成分分析法 / ゾーン分離法 / クロストークキャンセラ / 遠隔拡声通信会議 / 伝達関数 / 剛球モデル / 球殻音源 / 擬似口 |
Research Abstract |
1)複数話者(音源)信号分離手法の研究 本研究の目的は、ある1話者の音声だけに注目して、その音声だけを複数の話者の中から、音質の劣化なしに抽出することである。平成15年度は遠隔通信会議系の収音側における従前の2話者分離手法における性能比較を中心に検討してきた。平成16年度は3人以上の同時複数発話者に対応できる1話者に2マイクを用いる手法を提案した。本提案は複数音声が混合されている時、適度なブロック長で周波数領域に変換し、ブロック化毎に非目的音声信号の強い方向を推定し、その方向の死角を形成し目的音声を強調させて得る方法である。この手法は死角型ビームフォーマと減算型ビームフォーマの相互の特徴を有したものである。 2および3同時発話者での分離性能について、シミュレーションによる客観評価と受聴試験による主観評価により、本手法と従来手法との比較検討を行った。客観評価では、目的音声に対して非目的音声が抑圧される量(非目的音声抑圧量)と、分離されて出力された目的音声の音質測度として目的信号の入力信号と出力信号の正規化相互相関関数の最大値(出力信号の歪量)を評価指標とした。比較する従前手法は独立成分分析法、ゾーン分離法、減算型ビームフォーマであり、目的音声を女声日本語、非目的音声を男声日本語、男声英語発話とした。この結果、2つの評価値で、もっとも良い結果を得たのは提案手法であった。次に主観評価では隠れ基準付き三刺激二重盲検法を用い受聴試験を行った結果、提案手法が最も良い性能を得た。この研究成果を論文化し公表する。 2)伝達特性の変動の研究 平成15年度は発話者の音声が隣接者や、テーブルに反射してマイクに入力される影響、またマイクの高さの影響について理論と実験により確認した。その結果を論文化して公表した。 平成16年度は研究をさらに進めて、高臨場感通信では話者の頭部回転をどのような要因で人間は知覚するのかの実験と理論検討を開始した。第1ステップとして球殻音源を作製し、視覚情報をなくすために音響透過カーテンを用い、その球殻音源からの放射方向を変化させた受聴試験を実施した。その結果、70%から90%の確度で球殻音源方向を知覚できることが判明した。今後は、その要因を探る研究を開始する。
|
Research Products
(7 results)