• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ゆっくり喋ると認識されやすい音声認識システムの開発

研究課題

研究課題/領域番号 18700174
研究種目

若手研究(B)

配分区分補助金
研究分野 知覚情報処理・知能ロボティクス
研究機関豊橋技術科学大学 (2007-2008)
信州大学 (2006)

研究代表者

山本 一公  豊橋技術科学大学, 工学部, 助教 (40324230)

研究期間 (年度) 2006 – 2008
研究課題ステータス 完了 (2008年度)
配分額 *注記
3,540千円 (直接経費: 3,300千円、間接経費: 240千円)
2008年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2007年度: 800千円 (直接経費: 800千円)
2006年度: 1,700千円 (直接経費: 1,700千円)
キーワード音声認識 / 発話速度変動 / 挿入ペナルティ / 言語重み / 訂正発話 / 発話速度推定 / 対角共分散行列 / 全共分散行列 / 自然発話音声 / 発音変動 / 音響モデル / 信頼度 / 分布間距離
研究概要

音声認識システムを使用時に誤認識が発生すると、人間であるユーザは訂正発話をゆっくりとした発話速度で行う傾向があるが、現在の音声認識システムはゆっくりした発話速度の音声の認識精度が悪いため悪循環となっている。本研究では、発話速度を自動推定し、その結果から最適な音声認識システムパラメータ(挿入ペナルティ、言語重み)を自動的に調整することでゆっくりした発話速度の音声の認識精度を大幅に改善した。

報告書

(4件)
  • 2008 実績報告書   研究成果報告書 ( PDF )
  • 2007 実績報告書
  • 2006 実績報告書
  • 研究成果

    (2件)

すべて 2009

すべて 学会発表 (2件)

  • [学会発表] 挿入ペナルティの自動推定による遅い発話に対する音声認識性能の改善2009

    • 著者名/発表者名
      荻山将成、山本一公、藤井康寿、中川聖一
    • 学会等名
      日本音響学会2009年春季研究発表会
    • 発表場所
      東京工業大学
    • 年月日
      2009-03-19
    • 関連する報告書
      2008 実績報告書 2008 研究成果報告書
  • [学会発表] 音声認識における多次元ガウス分布の全共分散行列の要素制限手法2009

    • 著者名/発表者名
      末吉英一、山本一公、中川聖一
    • 学会等名
      日本音響学会2009年春季研究発表会
    • 発表場所
      東京工業大学
    • 年月日
      2009-03-17
    • 関連する報告書
      2008 実績報告書 2008 研究成果報告書

URL: 

公開日: 2006-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi