• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

話し言葉を対象とする大語彙連続音声認識の高性能化

Research Project

Project/Area Number 18500126
Research InstitutionYamagata University

Principal Investigator

好田 正紀  Yamagata University, 大学院・理工学研究科, 教授 (00205337)

Co-Investigator(Kenkyū-buntansha) 小坂 哲夫  山形大学, 大学院・理工学研究科, 准教授 (50359569)
加藤 正治  山形大学, 大学院・理工学研究科, 助手 (10250953)
Keywords日本語話し言葉コーパス / 音声認識 / 音響モデル / 言語モデル / 教師なし適応 / システム統合
Research Abstract

日本語話し言葉コーパス(CSJ)を用いて大語彙連続音声認識の音響モデル、言語モデル、デコーダ、モデル適応、システム統合の高性能化に関する検討を進めた。
1 音響モデルの高性能化
出力確率の分布形状として対角共分散モデルを拡張したブロック型全共分散モデル、モデル学習法として最尤推定法を拡張した識別学習、音素環境依存モデルとしてtriphoneモデルを拡張したquinphoneモデル、初期モデルとして認識対象話者に近い話者で作成した話者クラス音響モデルの利用、雑音/音楽環境下の音声認識のための音響モデル構成法、等の検討を行なった。
2 言語モデルの高性能化
単語N-gramと品詞N-gramの混合モデル、PLSA(確率的潜在意味解析)に基づく言語モデル、認識対象と話題の異なる議事録の利用、話題の類似したWebテキストの収集、等の検討を行なった。
3 デコーダの高性能化
混合モデルによる単語グラフのリスコア、等の検討を行なった。
4 モデル適応の高性能化
教師なし適応の繰り返し、適応データの選択や重み付け、PLSAに基づく単語N-gramや品詞N-gramの適応、ヒストグラム同等化を用いる話者適応、適応の種モデルとは異なるモデルで作成した適応データを用いるクロス適応、等の検討を行なった。
5 システム統合の高性能化
単語グラフの統合に基づくシステム統合、等の検討を行なった。

  • Research Products

    (17 results)

All 2008 2007

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (14 results) Book (1 results)

  • [Journal Article] Histogram equalization for noise robust speech recognition by using discrete-mixture HMMs2008

    • Author(s)
      T. Kosaka
    • Journal Title

      Acoustical Science and Technology 29

      Pages: 66-73

    • Peer Reviewed
  • [Journal Article] 音素モデルを用いた話者ベクトルに基づく話者識腹2007

    • Author(s)
      小坂哲夫
    • Journal Title

      電子情報帳信学会論文誌D J90-D

      Pages: 3201-3209

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Presentation] 日本語話し言葉コーパスにおける話者クラス音響モデルの効果2008

    • Author(s)
      武田優依
    • Organizer
      音響学会、1-Q-21
    • Place of Presentation
      千葉工業大学
    • Year and Date
      20080300
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] マルチコンディションモデルを用いた音楽環境下の音声認識の検討2008

    • Author(s)
      大貫芳久
    • Organizer
      情報処理学会東北支部研究会、07-6-C-1-1
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] 話者ベクトルを用いた話者照合の検討2008

    • Author(s)
      田所直樹
    • Organizer
      情報処理学会東北支部研究会、07-6-C-1-2
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] ヒストグラム同等化を用いた話者適応の検討2008

    • Author(s)
      熊倉拓哉
    • Organizer
      情報処理学会東北支部研究会、07-6-C-1-3
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] 全共分散音響モデルの性能評価2008

    • Author(s)
      伊藤貴
    • Organizer
      情報処理学会東北支部研究会、07-6-C-1-4
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] quinphone音響モデルの検討2008

    • Author(s)
      東海林拓
    • Organizer
      情報処理学会東北支部研究会、07-6-C-2-1
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] 話し言葉音声認識のPLSA言語モデル適応2008

    • Author(s)
      加藤正治
    • Organizer
      情報処理学会東北支部研究会、07-6-C-2-2
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] PLSAに基づくクラスN-gram言語モデルの適応2008

    • Author(s)
      梅本真模
    • Organizer
      情報処理学会東北支部研究会、07-6-C-2-3
    • Place of Presentation
      山形大学
    • Year and Date
      20080300
  • [Presentation] 音素クラスHMMを使用した話者ベクトルに基づく話者識別法の検討2007

    • Author(s)
      赤津達也
    • Organizer
      電子情報通信学会技術研究報告、SP2007-135
    • Place of Presentation
      NTTけいはんな
    • Year and Date
      20071200
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] Spontaneous speech recognition using discrete-mixture HMMs2007

    • Author(s)
      T., Kosaka
    • Organizer
      International Congress on Acoustics 2007
    • Place of Presentation
      マドリード、スペイン
    • Year and Date
      20070900
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] 繰り返し教師なし適応による講演音声認識2007

    • Author(s)
      草間 隆
    • Organizer
      音響学会、2-3-14
    • Place of Presentation
      山梨大学
    • Year and Date
      20070900
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] 識別学習による講演音声認識の性能改善2007

    • Author(s)
      関東純平
    • Organizer
      東北大学電気通信研究所音響工学研究会、348-2
    • Place of Presentation
      東北大学
    • Year and Date
      20070700
  • [Presentation] 話者ベクトルによる雑音下話者識別の検討2007

    • Author(s)
      後藤佑樹
    • Organizer
      電子情報通信学会技術研究報告、SP2007-18
    • Place of Presentation
      会津大学
    • Year and Date
      20070600
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] 講演音声認識における教師なし適応の改善2007

    • Author(s)
      草間 隆
    • Organizer
      電子情報通信学会技術研究報告、SP2007-20
    • Place of Presentation
      会津大学
    • Year and Date
      20070600
    • Description
      「研究成果報告書概要(和文)」より
  • [Book] Robust Speech Recognition and Understanding2007

    • Author(s)
      T. Kosaka(分担執筆)
    • Total Pages
      18
    • Publisher
      I-Tech

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi