2004 Fiscal Year Annual Research Report

話し言葉音声認識の高性能化

Research Project

Project/Area Number	15500098
Research Institution	Yamagata University
Principal Investigator	好田正紀山形大学, 工学部, 教授 (00205337)
Co-Investigator(Kenkyū-buntansha)	小坂哲夫山形大学, 工学部, 助教授 (50359569) 加藤正治山形大学, 工学部, 助手 (10250953)
Keywords	日本語話し言葉コーパス / 音声認識 / 音響モデル / 言語モデル / 発音変形依存モデル / 教師なし適応 / MLLR / 品詞N-gram
Research Abstract	今年度は、2004年6月に公開された日本語話し言葉コーパス(公開版CSJ)を用いて、講演音声認識の性能評価を行なった。公開版CSJ(2702講演、695万語)には、昨年度まで利用していたモニター版CSJの約8倍のデータ量があるため、音響モデルや言語モテルの改善を進めて、初期の目標(平成17年度に単語誤り率10%程度を達成する)を目指した。 (1)学習データ量の検討公開版CSJの1/8、1/4、1/2、allからなる学習セットを用いて(1/8はモニター版CSJのデータ量に相当する)、音響モデルおよび言語モデルをそれぞれ4種類作成し、音響モデルと言語モデルの種々の組合せについて、評価セット1(10講演)で性能評価した。その結果、次のことがわかった。・言語モデルは、学習データ増加によるパープレキシティ(PP)、単語誤り率(WER)の改善効果が大きい・音響モデルも同様に、学習データ増加による改善効果がみられるが、言語モデルほど顕著ではない・公開版CSJ 1/8からallへ学習データ増加により、PPは121.0から90.4、WERは26.04%から20.00%に減少する (2)語彙セットの検討公開版CSJには学会講演と模擬講演がある。次の4タイプの語彙セットを検討する。 (タイプ1)学会講演のみからn回以上出現の単語(n=1〜4) (タイプ2)学会講演と模擬講演の全体からn回以上出現の単語(n=2〜5) (タイプ3)学会講演から2回以上出現の単語と模擬講演からn回以上出現の単語(n=1〜4) (タイプ4)学会講演から出現上位2万語と模擬講演から2回以上出現の単語その結果、タイプ3の語彙セットが最も良いことがわかり、WER19.86%を得た。

Research Products
(7 results)

All 2005 2004

All Journal Article (7 results)

[Journal Article] 日本語話し言葉コーパスの形態素解析2005
- Author(s)
  加藤正治
- Journal Title
  
  情報処理学会東北支部研究会 04-6-A1-3
  
  Pages: 1-8
[Journal Article] 日本語話し言葉コーパスを用いた講演音声認識の性能評価2005
- Author(s)
  阿部拓也
- Journal Title
  
  情報処理学会東北支部研究会 04-6-A1-4
  
  Pages: 1-8
[Journal Article] 分散音声認識システムにおける話者ベクトルを用いた話者識別の検討2005
- Author(s)
  松本和樹
- Journal Title
  
  情報処理学会東北支部研究会 04-6-A2-1
  
  Pages: 1-8
[Journal Article] 離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価2005
- Author(s)
  小坂哲夫
- Journal Title
  
  日本音響学会講演論文集(春季) 3-5-11
  
  Pages: 97-98
[Journal Article] Robust speech recognition under non-stationary noise using discrete-mixture HMMs2005
- Author(s)
  小坂哲夫
- Journal Title
  
  2005 RISP International Workshop on Nonlinear Circuits and Signal Processing
  
  Pages: 347-350
[Journal Article] ETSI標準フロントエンドを用いた雑音下音声認識の検討2004
- Author(s)
  福士なな子
- Journal Title
  
  電子情報通信学会技術研究報告 104,86(SP2004-11)
  
  Pages: 7-12
[Journal Article] 参議院会議の音声認識2004
- Author(s)
  加藤正治
- Journal Title
  
  日本音響学会講演論文集(秋季) 2-1-2
  
  Pages: 39-40

2004 Fiscal Year Annual Research Report

話し言葉音声認識の高性能化

Principal Investigator

好田 正紀 山形大学, 工学部, 教授 (00205337)

Research Products

[Journal Article] 日本語話し言葉コーパスの形態素解析2005

Author(s)

Journal Title

[Journal Article] 日本語話し言葉コーパスを用いた講演音声認識の性能評価2005

Author(s)

Journal Title

[Journal Article] 分散音声認識システムにおける話者ベクトルを用いた話者識別の検討2005

Author(s)

Journal Title

[Journal Article] 離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価2005

Author(s)

Journal Title

[Journal Article] Robust speech recognition under non-stationary noise using discrete-mixture HMMs2005

Author(s)

Journal Title

[Journal Article] ETSI標準フロントエンドを用いた雑音下音声認識の検討2004

Author(s)

Journal Title

[Journal Article] 参議院会議の音声認識2004

Author(s)

Journal Title

好田正紀山形大学, 工学部, 教授 (00205337)