• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

話し言葉音声認識の高性能化

Research Project

Project/Area Number 15500098
Research InstitutionYamagata University

Principal Investigator

好田 正紀  山形大学, 工学部, 教授 (00205337)

Co-Investigator(Kenkyū-buntansha) 小坂 哲夫  山形大学, 工学部, 助教授 (50359569)
加藤 正治  山形大学, 工学部, 助手 (10250953)
Keywords日本語話し言葉コーパス / 音声認識 / 音響モデル / 言語モデル / 教師なし適応 / 混合連続分布HMM / 離散混合分布HMM
Research Abstract

2004年6月に公開された日本語話し言葉コーパス(CSJ)を用いて、講演音声認識の検討を行った。
1 教師なし適応による性能改善
まず音響モデルを2回適応し、次いで言語モデルを2回適応した。これを2回繰り返して音響モデル,言語モデルそれぞれを延べ4回ずつ、計8回の適応を行った。その結果次のことがわかり、当初目標達成の可能性を確認した。
(1)単語誤り率(WER)は適応前の19.96%から適応後は15.41%に減少し、繰り返し適応は効果的である。
(2)単語グラフはグラフ誤り率(GER)7%以下と高性能である。デコーダ第2パスのリスコアリングをうまく行えばWERを10%程度まで減少できる可能性がある。
(3)教師あり適応の場合、適応後のWERは8.12%まで減少する。認識結果全体(音素誤り率は適応前10.05%、適応後7.63%)の中から、音素誤り率の比較的小さい認識結果のみをうまく選択して適応データの精度が上がれば、WERを10%程度まで減少できる可能性がある。
2 離散混合分布HMMの性能評価
正規分布を仮定する混合連続分布HMMに対して離散混合分布HMMは、任意の分布形状が表現可能なため広範な発声環境に頑健な認識性能が期待できる。CSJを用いた講演音声認識により、次のことがわかった。
(1)離散混合分布HMMによるWERは20.30%である。これは通常の混合連続分布HMMと同等の結果である。
(2)離散混合分布HMMは雑音環境下の音声認識に頑健であることはすでに確認されているが、CSJのように発声環境の比較的良い条件下でも有効である。

  • Research Products

    (14 results)

All 2006 2005

All Journal Article (14 results)

  • [Journal Article] 発音変形依存モデルを用いた講演音声認識2006

    • Author(s)
      堤怜介
    • Journal Title

      電子情報通信学会論文誌 J89-D,2

      Pages: 305-313

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 巻き起こしと講演録を用いた言語モデルの作成法の検討2006

    • Author(s)
      加藤正治
    • Journal Title

      日本音響学会講演論文集(春季) 3-1-7

      Pages: 1203-1204

  • [Journal Article] 日本語話し言葉コーパスを用いた教師なし適応による講演音声認識の性能改善2006

    • Author(s)
      阿部拓也
    • Journal Title

      日本音響学会講演論文集(春季) 3-1-8

      Pages: 1205-1206

  • [Journal Article] 離散混合分布HMMのコードブック正規化による雑音下音声認識2006

    • Author(s)
      遠藤大悟
    • Journal Title

      日本音響学会講演論文集(春季) 3-1-16

      Pages: 139-140

  • [Journal Article] ヒストグラム同等化を用いた離散混合分布HMMのコードブック適応2006

    • Author(s)
      熊倉拓哉
    • Journal Title

      情報処理学会東北支部研究会 05-5-A1-1

      Pages: 1-7

  • [Journal Article] 話者ベクトルを用いた雑音下話者認識手法の検討2006

    • Author(s)
      赤津達也
    • Journal Title

      情報処理学会東北支部研究会 05-5-A1-2

      Pages: 1-7

  • [Journal Article] 教師なし適応による講演音声認識の性能改善2006

    • Author(s)
      草間隆
    • Journal Title

      情報処理学会東北支部研究会 05-5-A1-3

      Pages: 1-8

  • [Journal Article] 書き起こしと講演録を用いた言語モデルの作成法の検討2006

    • Author(s)
      梅本真模
    • Journal Title

      情報処理学会東北支部研究会 05-5-A1-4

      Pages: 1-8

  • [Journal Article] 日本語話し言葉コーパスを用いた音声要約の検討2006

    • Author(s)
      宇野涼子
    • Journal Title

      情報処理学会東北支部研究会 05-5-A1-5

      Pages: 1-8

  • [Journal Article] 離散混合分布型HMMによる講演音声認識の検討2005

    • Author(s)
      小坂哲夫
    • Journal Title

      電子情報通信学会技術研究報告 SP2005-25

      Pages: 31-36

  • [Journal Article] 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価2005

    • Author(s)
      阿部拓也
    • Journal Title

      日本音響学会講演論文集(秋季) 2-1-1

      Pages: 44

  • [Journal Article] 日本語話し言葉コーパスによる離散混合分布型HMMの評価2005

    • Author(s)
      小坂哲夫
    • Journal Title

      日本音響学会講演論文集(秋季) 2-7-19

      Pages: 64

  • [Journal Article] 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価2005

    • Author(s)
      阿部拓也
    • Journal Title

      電子情報通信学会技術研究報告 SP2005-94

      Pages: 25-30

  • [Journal Article] Rebust Speech Recognition Using Discrete-Mixture HMMs2005

    • Author(s)
      小坂哲夫
    • Journal Title

      IEICE Trans. on Information and Systems(電子情報通信学会英文論文誌) E88-D,12

      Pages: 2811-2818

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi