2008 Fiscal Year Annual Research Report
Project/Area Number |
19300060
|
Research Institution | Nagoya University |
Principal Investigator |
武田 一哉 Nagoya University, 大学院・情報科学研究科, 教授 (20273295)
|
Co-Investigator(Kenkyū-buntansha) |
北岡 教英 名古屋大学, 大学院・情報科学研究科, 准教授 (10333501)
宮島 千代美 名古屋大学, 大学院・情報科学研究科, 助教 (90335092)
山田 武志 筑波大学, 大学院・システム情報工学研究科, 准教授 (20312829)
西浦 敬信 立命館大学, 情報理工学部, 准教授 (70343275)
田村 哲嗣 岐阜大学, 工学部, 助教 (10402215)
|
Keywords | 雑音下音声認識 / 乗法性雑音 / 音声区間検出 / ロンバード効果 / Audio-visual音声認識 / 音声認識評価基盤 |
Research Abstract |
これまで加法性雑音下音声認識評価基盤(CENSREC-1, 2, 3)を多く収集したが、乗法性雑音下音声認識評価用のデータベースの評価基盤CENSREC-4を作成し、国際会議でも一般公開に至った。本DBには8種類の実環境で収集した残響(=乗法性雑音)をクリーン音声に畳み込んでシミュレートされた残響下音声、およびそのうち4環境では実際に人間がその場で発声した実音声も収録した。また、それらを効率的に除去して音声認識率を向上させる方法についても研究を行った。 また、雑音下で音声が変形するロンバード効果についても分析し、3種類の性質の異なる雑音下においてさまざまなSNRのもとでのロンバード音声収録を行った。そして、第2フォルマントへの影響が大きいなどの独特の性質を見出した。 さらに、雑音下で音声が使えなくても認識可能な映像も同期収録したデータベースの構築を進めている。これらも本研究期間中にCENSREC-AVとして公開予定である。 また、雑音や残響の音声認識への影響を分析し、それらを測る評価指標の改良を引き続き行っている。これによってDBの雑音の被服率や、事前の雑音の性質把握などを可能にできるようなりつつある。を考案し、事前に音声認識への影響を推測する方法の研究を行い、効果を得た。 これとは別に、音楽などの非定常性が非常に高い雑音に対する分析および抑圧方法も検討を開始し、一定の効果を得た。今後これらの性質を明らかにしてより一般的なDB構築や手法考案に向けての研究を開始したといえる。
|
Research Products
(19 results)
-
[Journal Article] CENSREC-1-C : An evaluation framework for voice activity detection under noisy environments2009
Author(s)
N. Kitaoka, T. Yamada, S. Tsuge, C. Miyajima, K. Yamamoto, T. Nishiura, M. Nakayama, Y. Denda, M. Fujimoto, T. Takiguchi, S. Tamura, S. Matsuda, T. Ogawa, S. Kuroiwa, K. Takeda, S. Nakamura
-
Journal Title
Acoustical Science and Technology (未定掲載決定)
Peer Reviewed
-
-
-
-
-
-
[Presentation] 音声認識の頑健性2009
Author(s)
北岡教英, 大淵康成, 滝口哲也, 中村哲, 藤本雅清
Organizer
情報処理学会音声言語情報処理研究会
Place of Presentation
新潟県・湯沢東映ホテル
Year and Date
2009-02-06
-
-
-
[Presentation] CENSREC-4 : Development of evaluation framework for distant-talking speech recognition under reverberant environments2008
Author(s)
M. Nakayama, T. Nishiura, Y. Denda, N. Kitaoka, K. Yamamoto, T. Yamada, S. Tsuge, C. Miyajima, M. Fujimoto, T. Takiguchi, S. Tamura, T. Ogawa, S. Matsuda, S. Kuroiwa, K. Takeda, S. Nakamura
Organizer
International Conference on Spoken Language Processing (INTERSPEECH 2008)
Place of Presentation
Brisbane, Australia
Year and Date
2008-09-24
-
-
-
-
-
-
-
-
-
[Presentation] Evaluation Framework for Distant-talking Speech Recognition under Reverberant Environments ; Newest Part of the CENSREC Series2008
Author(s)
T. Nishiura, M. Nakayama, Y. Denda, N. Kitaoka, K. Yamamoto, T. Yamada, S. Tsuge, C. Miyajima, M. Fujimoto, T. Takiguchi, S. Tamura, S. Kuroiwa, K. Takeda, S. Nakamura
Organizer
The 6th Edition of Language Resources and Evaluation Conference (LREC 2008)
Place of Presentation
Marrakech, Morocco
Year and Date
2008-05-29