• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

雑音に頑健な音声認識手法の開発とモバイル環境への応用

Research Project

Project/Area Number 16500097
Research InstitutionYamagata University

Principal Investigator

小坂 哲夫  山形大学, 工学部, 助教授 (50359569)

Co-Investigator(Kenkyū-buntansha) 好田 正紀  山形大学, 工学部, 教授 (00205337)
加藤 正治  山形大学, 工学部, 助手 (10250953)
Keywords音声認識 / 耐雑音性 / 隠れマルコフモデル / MAP推定 / 分散音声認識 / モバイル環境
Research Abstract

1)離散混合出力分布型HMMによる音声認識の複合雑音環境下における評価
これまで,雑音下音声認識に有効な音響モデルとして離散混合出力分布型HMM(DMHMM)の検討を行ってきた.一般に音声認識においては,音響モデルとして混合連続分布型HMM(CHMM)が使用されているが,雑音が重畳した場合の音声では混合分布でも対応が不可能である場合が想定される.このようなデータに対しては,正規分布の仮定のない,離散分布型HMMが有用である.このDMHMMは,これまでの検討により一般の環境雑音および突発性雑音下の音声認識に有効であることが分かっている.ここで突発性雑音と,ドアの開閉音,物体の落下音,舌打ちなど,短時間ではあるが周波数の特徴のばらつきが大きな雑音のことであり,音声認識に極めて悪影響を与えることが分かっている.しかし実際の応用を想定すると,突発性雑音が単独で出現することは少なく,むしろ一般の環境雑音に混じって,このような音が混入する場合が多いと考えられる.そこで環境雑音と突発性雑音が複合した雑音環境下におけるDMHMMの性能の検討を行なった.その結果,一般のCHMMと比較して28.1%の性能の向上が得られた.また従来のCHMMに尤度補償法であるAcoustic backing-off(AB)を組み合わせた手法はCHMMと比較して性能の向上は5.5%に留まる.よってAB法と比較しても高い性能が得られることが分かった.
2)離散混合分布HMMのコードブック正規化による雑音下音声認識
本研究ではDMHMMを用いた雑音下音声認識の更なる性能向上を目指し,雑音環境下におけるコードブック正規化の検討を行った.コードブック正規化には,従来特徴量正規化として有効性が確認されているヒストグラム同等化法(HEQ)を用い,雑音ごと,または1発話ごとでそれぞれ正規化を行った.この方法はDMHMMのコードブックを変更するため,音響モデル全体を変更することになる.モデル側での対処のため,パラメータ計算時に入力特徴量を1フレームごと正規化する必要がない.またモデルの種類ごと正規化のための変換関数を変えることも可能であるなどの利点がある.本研究では,男性10名の新聞読み上げ記事100文に,4種類の雑音をSNR=10dBで重畳したデータで評価実験を行った.その結果「雑音ごと」,「1発話ごと」のいずれの方法でも性能が向上することが分かった.また両者の比較では1発話ごとで正規化する場合がより性能が高い.以上により本手法の環境雑音下での有効性が確認された.

  • Research Products

    (9 results)

All 2006 2005

All Journal Article (9 results)

  • [Journal Article] 発音変形依存モデルを用いた講演音声認識2006

    • Author(s)
      堤怜介, 加藤正治, 小坂哲夫, 好田正紀
    • Journal Title

      電子情報通信学会論文誌D Vol.J89-D,No.2

      Pages: 305-313

  • [Journal Article] 書き起こしと講演録を用いた言語モデルの作成法の検討2006

    • Author(s)
      加藤正治, 梅本真模, 小坂哲夫, 好田正紀
    • Journal Title

      日本音響学会講演論文集 3-1-7

      Pages: 1203-1204

  • [Journal Article] 日本語話し言葉コーパスを用いた教師なし適応による講演音声認識の性能改善2006

    • Author(s)
      阿部拓也, 草間隆, 武田千春, 加藤正治, 小坂哲夫, 好田正紀
    • Journal Title

      日本音響学会講演論文集 3-1-8

      Pages: 1205-1206

  • [Journal Article] 離散混合分布HMMのコードブック正規化による雑音下音声認識2006

    • Author(s)
      遠藤大悟, 加藤正治, 小坂哲夫, 好田正紀
    • Journal Title

      日本音響学会講演論文集 3-1-16

      Pages: 139-140

  • [Journal Article] Robust Speech Recognition Using Discrete-Mixture HMMs2005

    • Author(s)
      T.Kosaka, M.Katoh, M.Kohda
    • Journal Title

      IEICE Transaction on Information and Systems Vol.E88-D No.12

      Pages: 2811-2818

  • [Journal Article] 離散混合分布型HMMによる講演音声認識の検討2005

    • Author(s)
      小坂哲夫, 山本明祥, 加藤正治, 好田正紀
    • Journal Title

      電子情報通信学会技術研究報告 SP2005-25

      Pages: 31-36

  • [Journal Article] 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価2005

    • Author(s)
      阿部拓也, 武田千春, 加藤正治, 小坂哲夫, 好田正紀
    • Journal Title

      日本音響学会講演論文集 2-1-1

      Pages: 37-38

  • [Journal Article] 日本語話し言葉コーパスによる離散混合分布HMMの評価2005

    • Author(s)
      小坂哲夫, 山本明祥, 加藤正治, 好田正紀
    • Journal Title

      日本音響学会講演論文集 2-7-19

      Pages: 95-96

  • [Journal Article] 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評2005

    • Author(s)
      阿部拓也, 草間隆, 武田千春, 加藤正治, 小坂哲夫, 好田正紀
    • Journal Title

      電子情報通信学会技術研究報告 SP2005-94

      Pages: 25-30

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi