• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

対話音声認識における環境や話し方の影響評定を備えた音声理解システムの研究

Research Project

Project/Area Number 21500165
Research InstitutionShizuoka University

Principal Investigator

甲斐 充彦  静岡大学, 工学部, 准教授 (60283496)

Co-Investigator(Kenkyū-buntansha) 小暮 悟  静岡大学, 情報学部, 講師 (40359758)
王 龍標  静岡大学, 工学部, 助教 (30510458)
Keywords音声認識 / 認識性能予測 / 話者性 / 明瞭性 / SNR / 認識信頼度 / 対話制御
Research Abstract

1)話し方や環境の違いに注目した認識性能の分析・推定モデルの改善
本年度は話者の違いに注目するため134名分の多数話者の単語発話データを用いた分析を行った。これによって、話者間の認識性能の変動要因から発話内容の違いによる影響を除外し、話し方や声質の違いによる認識性能への影響に焦点を当てた分析を行った。また、話者間での認識性能の違いに影響を与える要因として、個人が意図的にコントロール可能な発話様式の変動と、それ以外の話者固有の声質や環境の違いによる影響を区別するため、前者については明瞭性や発話速度、後者については母音構造の歪みや信号対雑音比(SNR)などの特徴量を自動抽出することによって分析を行った。多数の特徴量と認識性能との関係を分析するため重回帰分析をはじめ、ロジスティック回帰分析、ベイジアンネットワークの3種類の方法を用いて比較評価を行った。分析に用いた134名の話者別の連続音節認識の正解精度を認識性能の指標として、認識精度の高低のクラス判別として認識性能の予測精度を評価した。交差検証による評価実験の結果、本研究で用いた特徴量セットにおいては重回帰モデルによる方法が最も高い予測性能を得た。また、関連研究として人工的に生成した室内インパルス応答による人工残響環境での話者モデル化の有効性を確認し、より多様な環境要因の影響分析に今後使える可能性が示された。
2)認識性能予測を想定した対話制御方式の効果検証
音声認識システムを用いた対話的なインタフェースでは、ユーザ発話の認識結果の誤認識の可能性を考慮した応答内容の選択(対話制御)を行うアプローチの一つとして、認識信頼度を考慮する方法が一般的である。本研究では、そのような問題に対するアプローチの一つとして近年注目されているPOMDP(部分観測マルコフ決定過程)のモデルを採用し、認識性能の推定値を取り入れる方法の有効性を対話シミュレーションによって評価し、その有用性を示した。

  • Research Products

    (4 results)

All 2012

All Presentation (4 results)

  • [Presentation] 音声認識誤り率の推定を用いたPOMDPモデルの構築の検討2012

    • Author(s)
      西島祥悟, 甲斐充彦, 小暮悟, 王龍標
    • Organizer
      人工知能学会言語・音声理解と対話処理研究会
    • Place of Presentation
      東京大学(東京都)
    • Year and Date
      2012-03-26
  • [Presentation] 音声対話制御のためのHIS-POMDP学習・評価プロトタイプツールの開発2012

    • Author(s)
      野末隆史, 小暮悟, 甲斐充彦, 小西達裕, 伊東幸宏
    • Organizer
      人工知能学会言語・音声理解と対話処理研究会
    • Place of Presentation
      東京大学(東京都)
    • Year and Date
      2012-03-26
  • [Presentation] 話者や発話固有の特徴の違いに注目した認識性能の個人差の要因分析2012

    • Author(s)
      赤尾佳彦, 甲斐充彦, 王龍標
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川県)
    • Year and Date
      2012-03-15
  • [Presentation] 複数の人工室内インパルス応答を用いた残響モデルの利用による遠隔発話話者認識2012

    • Author(s)
      王龍標, 岸良樹, 張兆峰, 甲斐充彦
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      神奈川大学(神奈川県)
    • Year and Date
      2012-03-15

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi