• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

低認識精度発声に対する音声認識に関する研究

研究課題

研究課題/領域番号 15700163
研究機関徳島大学

研究代表者

柘植 覚  徳島大学, 工学部, 講師 (00325250)

キーワード音声認識 / 低音声認識精度発声 / 相関分析 / 音声認識精度の分析
研究概要

本研究の研究の目的は以下の2点である.
◆低認識精度発声の原因解明
◆低認識精度発声の認識精度向上
この目的を実現するために、次のことを実施した。
原因解明のため、現在定期的に収録を行っている特定話者長期間音声データベースを用い、様々な要因との相関分析を行った。この結果より、特定話者の場合、発話速度は音声認識精度への相関が低いことがわかった。これは、発話速度は置換誤りと相関が低いが、挿入誤りとは高い負の相関を持ち、脱落誤りとは高い正の相関を持つため、挿入誤りと脱落誤りが相殺し、発話速度と音声認識精度の相関が低いことがわかった。また、音声認識精度と母音の各正解率との相関をしらべ、母音/a/、/u/は音声認識精度との相関が高いことがわかった。
低認識精度発声の認識精度向上のため、原因解明のために使用したデータと同様のデータを使用して、認識精度向上のため、各発声日、発声時間帯に音響モデルを適応することを試みた。これは、認識率改善のためには、一日内の音声変動が有効化、同じ時間帯の音声が有効化を検討した。この検討の結果、音声認識精度改善のためには同一内に発声された音声を用い、音響モデルを適応することが有効であることがわかった。

  • 研究成果

    (6件)

すべて 2006 2005

すべて 雑誌論文 (6件)

  • [雑誌論文] Nonparametric Speaker Recognition Method Using Earth Mover's Distance2006

    • 著者名/発表者名
      Shingo Kuroiwa
    • 雑誌名

      IEICE Transactions on Information and Systems Vol.E89-D, No.3

      ページ: 1074-1081

  • [雑誌論文] Acoustic Model Adaptation for Cedec Speech based on Leaning-by-Doing Concept2006

    • 著者名/発表者名
      Shingo Kuroiwa
    • 雑誌名

      Advances in Natural Language Processing Research in Computing Science Vol.18

      ページ: 105-114

  • [雑誌論文] Specific, Speaker's Japanese Speech Corpus over Long and Short Time Periods2006

    • 著者名/発表者名
      Satoru Tsuge
    • 雑誌名

      Advances in Natural Language Processing Research in Computing Science Vol.18

      ページ: 115-124

  • [雑誌論文] Data Collection for Investigating Speech Variability in a Specific Speaker Over Long and Short Time Periods2005

    • 著者名/発表者名
      Satoru Tsuge
    • 雑誌名

      Proc.of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'05)

      ページ: 152-157

  • [雑誌論文] A Lost Speech Reconstruction Method Using Linguistic Information2005

    • 著者名/発表者名
      Shingo Kuroiwa
    • 雑誌名

      Proc.of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'05)

      ページ: 126-130

  • [雑誌論文] Frequency Characteristic Normalization Method Using Blind Equalization Technique with Multiple References for DSR2005

    • 著者名/発表者名
      Satoru Tsuge
    • 雑誌名

      Proc.of 10th International Conference SPEECH and COMPUTER (SPECOM2005) Vol.1

      ページ: 103-106

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi