研究課題
1)複数話者(音源)信号分離手法の研究本研究の目的は、ある1話者の音声だけに注目して、その音声だけを複数の話者の中から、音質の劣化なしに抽出することである。平成15年度は遠隔通信会議系の収音側における従前の2話者分離手法における性能比較を中心に検討してきた。平成16年度は3人以上の同時複数発話者に対応できる1話者に2マイクを用いる手法を提案した。本提案は複数音声が混合されている時、適度なブロック長で周波数領域に変換し、ブロック化毎に非目的音声信号の強い方向を推定し、その方向の死角を形成し目的音声を強調させて得る方法である。この手法は死角型ビームフォーマと減算型ビームフォーマの相互の特徴を有したものである。2および3同時発話者での分離性能について、シミュレーションによる客観評価と受聴試験による主観評価により、本手法と従来手法との比較検討を行った。客観評価では、目的音声に対して非目的音声が抑圧される量(非目的音声抑圧量)と、分離されて出力された目的音声の音質測度として目的信号の入力信号と出力信号の正規化相互相関関数の最大値(出力信号の歪量)を評価指標とした。比較する従前手法は独立成分分析法、ゾーン分離法、減算型ビームフォーマであり、目的音声を女声日本語、非目的音声を男声日本語、男声英語発話とした。この結果、2つの評価値で、もっとも良い結果を得たのは提案手法であった。次に主観評価では隠れ基準付き三刺激二重盲検法を用い受聴試験を行った結果、提案手法が最も良い性能を得た。この研究成果を論文化し公表する。2)伝達特性の変動の研究平成15年度は発話者の音声が隣接者や、テーブルに反射してマイクに入力される影響、またマイクの高さの影響について理論と実験により確認した。その結果を論文化して公表した。平成16年度は研究をさらに進めて、高臨場感通信では話者の頭部回転をどのような要因で人間は知覚するのかの実験と理論検討を開始した。第1ステップとして球殻音源を作製し、視覚情報をなくすために音響透過カーテンを用い、その球殻音源からの放射方向を変化させた受聴試験を実施した。その結果、70%から90%の確度で球殻音源方向を知覚できることが判明した。今後は、その要因を探る研究を開始する。
すべて 2005 2004
すべて 雑誌論文 (7件)
電子情報通信学会論文誌A J88-A, No.4
ページ: 457-467
電子情報通信学会論文誌A,6月号 J88-A, No.6(掲載予定)
日本音響学会2005年春季研究発表会講演論文集 3-Q-18
ページ: 541-542
日本音響学会2005年春季研究発表会講演論文集 3-Q-19
ページ: 543-544
2005年電子情報通信学会総合大会開演論文集 AS-4-5
ページ: S-69-S-70
電子情報通信学会 技術研究報告 応用音響 EA2004-72
ページ: 1-6
平成16年度電子情報通信学会信越支部大会 1D-3
ページ: 35-36