音源分離を規範とした音声認識手法に関する研究

研究課題

研究課題/領域番号	17650047
研究種目	萌芽研究
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	北陸先端科学技術大学院大学
研究代表者	赤木正人北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
研究分担者	鵜木祐史北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (00343187)
研究期間 (年度)	2005 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	3,200千円 (直接経費: 3,200千円) 2007年度: 900千円 (直接経費: 900千円) 2006年度: 1,100千円 (直接経費: 1,100千円) 2005年度: 1,200千円 (直接経費: 1,200千円)
キーワード	音声認識 / 音源分離 / 雑音 / パターン認識法 / 計算論的音情景解析 / 仮説検証
研究概要	本研究では,雑音をモデル化する必要がなくどのような雑音にも対処可能な音声認識手法の新しい枠組みを提案する。具体的には,申請者らが提案した音源分離手法を認識規範として,従来の枠組みにとらわれない認識法を提案する。このため,1年目は,提案する手法によって高精度の音声認識が可能かどうかの詳細な議論を行った。提案手法では,認識対象に関する情報をtop-down的に音源分離部へ与え,この情報を用いて分離が完了する(認識が行える)かどうかを観測する。比較的定常な楽器音の分離処理ではこの手法は成功しているが,母音系列に対しても適用可能かどうかの検討を行った。その結果,音声認識に使用可能であるという結論を得た。 2年目は,変化の激しい音声,特に単語に対して認識が行えるかどうかについて検討した。その結果,従来法であるスペクトルサブトラクション法とか音響モデル適応法に比較して誤り率が数十%減少した。これらを受けて,最終年度である本年度は,提案手法の有効性を検証するために,定常、非定常雑音環境で日本語数字認識を実施した。現有の手法である雑音抑圧前処理,および,参照パターン適応による認識結果との比較を行った結果,提案手法を用いたASRシステムは,どの雑音環境においても既存の手法の認識率を上回った。これは,提案手法が選択的音源分離を評価して得られた目的音の存在確度を用いて認識するため,また,提案手法が雑音モデルを一切用いていないためと考えられる。このことは,提案手法が様々な雑音環境で頑健に認識できる可能性があり,ASRシステムの頑健性向上の手法として有益である事を示すものである。

報告書

(3件)

研究成果
(7件)

すべて 2008 2007 2006 2005

すべて雑誌論文 (5件) (うち査読あり 3件) 学会発表 (2件)

[雑誌論文] A speech recognition method based on the selective sound segregation in vanous noisy environments2008
- 著者名/発表者名
  Atsushi Haniu, Masashi Unoki, and Masato Akagi
- 雑誌名
  
  Proc.NCSP08
  
  ページ: 168-171
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] A study on a speech recognition method based on the selective sound segregation in various noisy environments2007
- 著者名/発表者名
  Atsushi Haniu, Masashi Unoki, and Masato Akagi
- 雑誌名
  
  Proc.NOLTA2007
  
  ページ: 445-448
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] A study on a speech recognition method based on the selective sound segregation in noisy environment2007
- 著者名/発表者名
  Atsushi Haniu, Masashi Unoki, and Masato Akagi
- 雑誌名
  
  Proc.JCA2007 (CD-ROM)
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] A Model-Concept of the Selective Sound Segregation : -A Prototype Model for Selective Segregation of Target Instrument Sound from the Mixed bound of Various Instruments -2006
- 著者名/発表者名
  Unoki M., Kubo M., Haniu, A., Akagi, M.
- 雑誌名
  
  Journal of Signal Processing 10,6
  
  ページ: 419-431
- 関連する報告書
  2006 実績報告書
[雑誌論文] A model for selective segregation of a target instrument sound from the mixed sound of various instruments2005
- 著者名/発表者名
  Unoki, M., Kubo, M., Haniu, A., Akagi, M.
- 雑誌名
  
  Proc.EuroSpeech2005
  
  ページ: 2097-2100
- 関連する報告書
  2005 実績報告書
[学会発表] Improvement of robustness using selective sound segregation for automatic speech recognition systems in noisy environments2008
- 著者名/発表者名
  Atsushi Haniu, Masashi Unoki, and Masato Akagi
- 学会等名
  Asian Student workshop
- 発表場所
  Tokyo
- 年月日
  2008-03-20
- 関連する報告書
  2007 実績報告書
[学会発表] 雑音環境における選択的音源分離を規範とした音声認識2008
- 著者名/発表者名
  羽二生篤, 鵜木祐史, 赤木正人
- 学会等名
  日本音響学会平成20年春季研究発表会
- 発表場所
  千葉工業大学
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書

音源分離を規範とした音声認識手法に関する研究

研究代表者

赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)

3,200千円 (直接経費: 3,200千円)

報告書

研究成果

[雑誌論文] A speech recognition method based on the selective sound segregation in vanous noisy environments2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A study on a speech recognition method based on the selective sound segregation in various noisy environments2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A study on a speech recognition method based on the selective sound segregation in noisy environment2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Model-Concept of the Selective Sound Segregation : -A Prototype Model for Selective Segregation of Target Instrument Sound from the Mixed bound of Various Instruments -2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A model for selective segregation of a target instrument sound from the mixed sound of various instruments2005

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Improvement of robustness using selective sound segregation for automatic speech recognition systems in noisy environments2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 雑音環境における選択的音源分離を規範とした音声認識2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

赤木正人北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)