• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

話し言葉音声認識の高性能化

Research Project

Project/Area Number 15500098
Research InstitutionYamagata University

Principal Investigator

好田 正紀  山形大学, 工学部, 教授 (00205337)

Co-Investigator(Kenkyū-buntansha) 小坂 哲夫  山形大学, 工学部, 助教授 (50359569)
加藤 正治  山形大学, 工学部, 助手 (10250953)
Keywords日本語話し言葉コーパス / 音声認識 / 音響モデル / 言語モデル / 発音変形依存モデル / 教師なし適応 / MLLR / 品詞N-gram
Research Abstract

今年度は、2004年6月に公開された日本語話し言葉コーパス(公開版CSJ)を用いて、講演音声認識の性能評価を行なった。公開版CSJ(2702講演、695万語)には、昨年度まで利用していたモニター版CSJの約8倍のデータ量があるため、音響モデルや言語モテルの改善を進めて、初期の目標(平成17年度に単語誤り率10%程度を達成する)を目指した。
(1)学習データ量の検討
公開版CSJの1/8、1/4、1/2、allからなる学習セットを用いて(1/8はモニター版CSJのデータ量に相当する)、音響モデルおよび言語モデルをそれぞれ4種類作成し、音響モデルと言語モデルの種々の組合せについて、評価セット1(10講演)で性能評価した。その結果、次のことがわかった。
・言語モデルは、学習データ増加によるパープレキシティ(PP)、単語誤り率(WER)の改善効果が大きい
・音響モデルも同様に、学習データ増加による改善効果がみられるが、言語モデルほど顕著ではない
・公開版CSJ 1/8からallへ学習データ増加により、PPは121.0から90.4、WERは26.04%から20.00%に減少する
(2)語彙セットの検討
公開版CSJには学会講演と模擬講演がある。次の4タイプの語彙セットを検討する。
(タイプ1)学会講演のみからn回以上出現の単語(n=1〜4)
(タイプ2)学会講演と模擬講演の全体からn回以上出現の単語(n=2〜5)
(タイプ3)学会講演から2回以上出現の単語と模擬講演からn回以上出現の単語(n=1〜4)
(タイプ4)学会講演から出現上位2万語と模擬講演から2回以上出現の単語
その結果、タイプ3の語彙セットが最も良いことがわかり、WER19.86%を得た。

  • Research Products

    (7 results)

All 2005 2004

All Journal Article (7 results)

  • [Journal Article] 日本語話し言葉コーパスの形態素解析2005

    • Author(s)
      加藤 正治
    • Journal Title

      情報処理学会 東北支部研究会 04-6-A1-3

      Pages: 1-8

  • [Journal Article] 日本語話し言葉コーパスを用いた講演音声認識の性能評価2005

    • Author(s)
      阿部 拓也
    • Journal Title

      情報処理学会 東北支部研究会 04-6-A1-4

      Pages: 1-8

  • [Journal Article] 分散音声認識システムにおける話者ベクトルを用いた話者識別の検討2005

    • Author(s)
      松本 和樹
    • Journal Title

      情報処理学会 東北支部研究会 04-6-A2-1

      Pages: 1-8

  • [Journal Article] 離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価2005

    • Author(s)
      小坂 哲夫
    • Journal Title

      日本音響学会講演論文集(春季) 3-5-11

      Pages: 97-98

  • [Journal Article] Robust speech recognition under non-stationary noise using discrete-mixture HMMs2005

    • Author(s)
      小坂 哲夫
    • Journal Title

      2005 RISP International Workshop on Nonlinear Circuits and Signal Processing

      Pages: 347-350

  • [Journal Article] ETSI標準フロントエンドを用いた雑音下音声認識の検討2004

    • Author(s)
      福士 なな子
    • Journal Title

      電子情報通信学会 技術研究報告 104,86(SP2004-11)

      Pages: 7-12

  • [Journal Article] 参議院会議の音声認識2004

    • Author(s)
      加藤 正治
    • Journal Title

      日本音響学会講演論文集(秋季) 2-1-2

      Pages: 39-40

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi