マイクロホンアレーを用いた音環境の認識に関する研究

Research Project

Project/Area Number	12780259
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	University of Tsukuba
Principal Investigator	山田武志筑波大学, 電子・情報工学系, 講師 (20312829)
Project Period (FY)	2000 – 2001
Project Status	Completed (Fiscal Year 2001)
Budget Amount *help	¥1,800,000 (Direct Cost: ¥1,800,000) Fiscal Year 2001: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2000: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywords	実環境 / 環境音 / 音声区間検出 / 隠れマルコフモデル / HMM合成法 / モデル化 / 隠れマルコフ網 / 逐次状態分割法 / HMM / ビタビアライメント
Research Abstract	1.個々の音を抽出する技術:マイクロホンアレーによる音源抽出法において,複数の音源の位置を同時に推定し,かつ個々の音源の移動を追尾する機能を実現するために,3次元トレリス法の適用について検討している.3次元トレリス法の性能は,マイクロホンアレーの指向性ビームの鋭さが十分ではなく,他の方向からの音が重畳するような場合,大きく低下してしまう.この問題に対処するための方法としては,複数の環境音が重畳している区間を事前に検出し,あらかじめ重畳を考慮したモデルを用意することが考えられる.本研究では,環境音モデルとHMM合成法を用いて複数の環境音が重畳している区間を検出する方法を提案した.孤立単語,連続単語,文章と環境音が重畳している状況を想定した評価実験を行った結果,環境音が重畳している区間,重畳している環境音の種類とそのSN比を良好に検出できることが分かった.今後,このような重畳区間情報を利用して,3次元トレリス法の性能改善を図る予定である. 2.個々の音を認識する技術:HMMにより環境音をモデル化する際,HMMの単位と構造(状態数や状態の接続形態など)について検討する必要がある.まず,92種類の環境音を数種類の構造でモデル化し,認識実験を行った.その結果,環境音によって適した構造は異なっており,認識率に大きな差が生じることが分かった.次に,92種類の環境音を尤度最大化基準に基いてクラスタリングした結果,音響的に似た環境音同士がマージされるものの,クラスタリングの過程で構造を適応的に変化させる必要があることが分かった.そこで,HMMの単位や構造を,同じ基準の下で同時かつ自動的に決定する方法として,逐次状態分割による隠れマルコフ網の自動生成法を適用し,評価実験によりその有効性を確認した.今後,自動的に環境音を収録し,環境音のモデルを逐次的に更新する手法について検討する予定である.

Report

(2 results)

2001 Annual Research Report
2000 Annual Research Report

Research Products
(9 results)

All Other

All Publications (9 results)

[Publications] 山田武志: "隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討"電子情報通信学会研究技術報告. (発表予定). (2002)
- Related Report
  2001 Annual Research Report
[Publications] 渡部生聖: "環境音モデルとHMM合成による音声区間検出法の文章発話への適用"電子情報通信学会研究技術報告, SP2001-88. 25-30 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 渡部生聖: "環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討"日本音響学会講演論文集. 39-40 (2001)
- Related Report
  2001 Annual Research Report
[Publications] Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc. Workshop on Hands-free Speech Communication. 131-134 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 109-110 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 渡部生聖: "環境音モデルとHMM合成を用いた音声区間検出の検討"電子情報通信学会研究技術報告, SP2000-84. 55-60 (2000)
- Related Report
  2001 Annual Research Report
[Publications] Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc.Workshop on Hands-free Speech Communication. 発表予定. (2001)
- Related Report
  2000 Annual Research Report
[Publications] 渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 発表予定. (2001)
- Related Report
  2000 Annual Research Report
[Publications] 渡部生聖: "環境音モデルとHMM合成を用いた音声区間検出の検討"電子情報通信学会研究技術報告,SP2000-84. 55-60 (2000)
- Related Report
  2000 Annual Research Report

マイクロホンアレーを用いた音環境の認識に関する研究

Principal Investigator

山田 武志 筑波大学, 電子・情報工学系, 講師 (20312829)

¥1,800,000 (Direct Cost: ¥1,800,000)

Report

Research Products

[Publications] 山田武志: "隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討"電子情報通信学会研究技術報告. (発表予定). (2002)

Related Report

[Publications] 渡部生聖: "環境音モデルとHMM合成による音声区間検出法の文章発話への適用"電子情報通信学会研究技術報告, SP2001-88. 25-30 (2001)

Related Report

[Publications] 渡部生聖: "環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討"日本音響学会講演論文集. 39-40 (2001)

Related Report

[Publications] Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc. Workshop on Hands-free Speech Communication. 131-134 (2001)

Related Report

[Publications] 渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 109-110 (2001)

Related Report

[Publications] 渡部生聖: "環境音モデルとHMM合成を用いた音声区間検出の検討"電子情報通信学会研究技術報告, SP2000-84. 55-60 (2000)

Related Report

[Publications] Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc.Workshop on Hands-free Speech Communication. 発表予定. (2001)

Related Report

[Publications] 渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 発表予定. (2001)

Related Report

[Publications] 渡部生聖: "環境音モデルとHMM合成を用いた音声区間検出の検討"電子情報通信学会研究技術報告,SP2000-84. 55-60 (2000)

Related Report

山田武志筑波大学, 電子・情報工学系, 講師 (20312829)