• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

話し言葉を対象とする大語彙連続音声認識の高性能化

Research Project

Project/Area Number 18500126
Research Category

Grant-in-Aid for Scientific Research (C)

Research InstitutionYamagata University

Principal Investigator

好田 正紀  山形大学, 工学部, 教授 (00205337)

Co-Investigator(Kenkyū-buntansha) 小坂 哲夫  山形大学, 工学部, 助教授 (50359569)
加藤 正治  山形大学, 工学部, 助手 (10250953)
Keywords日本語話し言葉コーパス / 音声認識 / 音響モデル / 言語モデル / 教師なし適応 / 混合連続分布HMM / 離散混合分布HMM
Research Abstract

日本語話し言葉コーパス(CSJ)を用いて音響・言語モデルの高性能化と教師なし適応の改善に関する検討を行った。
1 音響・言語モデルの高性能化
(1)音響モデルに関しては、出力確率の分布形状として対角共分散モデルを拡張したブロック型全共分散モデルの検討を種々の条件について行い、状態数3000、混合数16の音響モデルの単語誤り率(WER)は対角共分散モデル20.79%に対して全共分散モデル19.17%と1.62ポイントの性能向上を確認した。さらに、モデル学習法として最尤推定法を拡張した識別学習、音素環境依存モデルとして前後1音素依存のtriphoneモデルを拡張した前後2音素依存のquinphoneモデル、離散混合分布HMMによるロバスト認識、等の検討を行った。
(2)言語モデルに関しては、trigramを拡張した4-gram、単語N-gramと品詞N-gramの混合モデル、学習テキストとして会議議事録や学会講演予稿葉の利用、等の検討を行った。
2 教師なし適応の改善
(1)教師なし適応の繰り返しに関しては、音響モデルと言語モデルの逐次/併行適応やデコード/リスコア適応の種々の組合せについて検討し、逐次・デコード適応、併行・デコード適応、併行・デコードリスコア適応、併行・リスコア適応の計算量比が8:4:2.44:1.66に対して、全共分散モデルの場合のWERはそれぞれ14.73%、14.99%、15.03%、15.22%となることを確認した。
(2)教師なし適応に用いる適応データに関しては、品詞情報に基づいて適応データの選択や重み付けを種々の条件について検討し、音素認識率が比較的良い8品詞に重み付けの場合に性能向上効果が大きいことを確認した。

  • Research Products

    (14 results)

All 2007 2006

All Journal Article (14 results)

  • [Journal Article] 音素構造距離を用いた英語発音自動評定の精度向上の検討2007

    • Author(s)
      山口涼子
    • Journal Title

      情報処理学会東北支部研究会 06-6-A1-1

      Pages: 1-8

  • [Journal Article] 日本語話し言葉コーパスを用いた離散混合分布HMMの性能評価2007

    • Author(s)
      山本秋祥
    • Journal Title

      情報処理学会東北支部研究会 06-6-A1-2

      Pages: 1-6

  • [Journal Article] 話し言葉音声認識における教師なし適応の改善2007

    • Author(s)
      草間隆
    • Journal Title

      情報処理学会東北支部研究会 06-6-A1-3

      Pages: 1-9

  • [Journal Article] 会議音声の話者インデキシングと話者適応2007

    • Author(s)
      齋藤徹也
    • Journal Title

      情報処理学会東北支部研究会 06-6-A1-4

      Pages: 1-7

  • [Journal Article] 参議院の議事録を用いた言語モデルの作成2007

    • Author(s)
      手塚収太
    • Journal Title

      情報処理学会東北支部研究会 06-6-A2-1

      Pages: 1-6

  • [Journal Article] 日本語話し言葉コーパスを用いた重要文抽出2007

    • Author(s)
      宇野涼子
    • Journal Title

      情報処理学会東北支部研究会 06-6-A2-2

      Pages: 1-8

  • [Journal Article] 話者ベクトルを用いた話者識別における次元圧縮の効果2007

    • Author(s)
      赤津達也
    • Journal Title

      日本音響学会講演論文集(春季) 1-P-18

      Pages: 159-160

  • [Journal Article] 離散混合分布HMMのヒストグラム同等化を用いたコードブック正規化2006

    • Author(s)
      小坂哲夫
    • Journal Title

      電子情報通信学会技術研究報告 SP2006-15

      Pages: 25-30

  • [Journal Article] コードブック適応を用いた離散混合分布型HMMによる講演音声認識2006

    • Author(s)
      山本明祥
    • Journal Title

      情報処理学会研究報告 2006-SLP-62

      Pages: 25-30

  • [Journal Article] コードブック適応を用いた離散混合分布型HMMによる講演音声認識2006

    • Author(s)
      山本明祥
    • Journal Title

      日本音響学会講演論文集(秋季) 2-2-9

      Pages: 69-70-

  • [Journal Article] 話者ベクトルを用いた話者識別法における音響モデルの検討2006

    • Author(s)
      赤津達也
    • Journal Title

      日本音響学会講演論文集(秋季) 2-P-10

      Pages: 113-114

  • [Journal Article] 参議院会議音声の言語モデル適応2006

    • Author(s)
      加藤正治
    • Journal Title

      日本音響学会講演論文集(秋季) 2-P-29

      Pages: 151-152

  • [Journal Article] Noisy Speech Recognition Based on Codebook Normalization of Discrete-Mixture HMMs2006

    • Author(s)
      T.Kosaka
    • Journal Title

      ASA/ASJ Forth Joint Meeting 1pSC27

      Pages: 3041-3041

  • [Journal Article] 音素モデルを用いた話者ベクトルに基づく話者識別の検討2006

    • Author(s)
      赤津達也
    • Journal Title

      電子情報通信学会技術研究報告 SP2006-101

      Pages: 95-99

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi