• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

誤認識原因の識別と通知に基づく音声認識のユーザビリティ改善

研究課題

研究課題/領域番号 17K00224
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理
研究機関筑波大学

研究代表者

山田 武志  筑波大学, システム情報系, 准教授 (20312829)

研究期間 (年度) 2017-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2017年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード音声認識 / ユーザビリティ / 認識性能推定 / 誤認識原因識別 / 発話特徴 / 変調スペクトル / 認識率推定 / 雑音 / 発話様式 / 音声等認識 / 機械学習 / ユーザインターフェース
研究成果の概要

実利用における音声認識の性能はユーザの話し方によって大きく変動する。しかし、一般のユーザにとって、このような性能変動を的確に把握することは極めて難しい。そこで本研究では、ユーザが発話した音声を正しく認識できるか否かを判断し、認識できないと判断した場合には、その原因を識別してユーザに分かり易く通知する手法を開発した。まず、高精度な認識成否判断と誤認識原因識別を実現するために、変調スペクトルと深層ニューラルネットワークを用いた手法を提案し、その有効性を確認した。そして、誤認識原因をユーザに通知するためのインタフェースを設計してPC上に実装した。

研究成果の学術的意義や社会的意義

本研究では、ユーザが発話した音声を正しく認識できるか否かを判断し、認識できないと判断した場合には、その原因を識別してユーザに分かり易く通知する手法を開発した。このような機能は本来ユーザインタフェースの一部として備わっているべきであるが、音声認識においてはこれまで実現していなかった。本研究成果により音声認識のユーザビリティが大きく改善し、音声認識サービスのさらなる普及につながると期待できる。また、本研究を通して既存の技術では認識が難しい音声特徴が明確になり、音声認識技術のさらなる高精度化を図るための指針を得た。

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (7件)

すべて 2020 2019 2018

すべて 学会発表 (7件) (うち国際学会 3件)

  • [学会発表] 発話の時間変動に着目した音声認識誤り区間推定の検討2020

    • 著者名/発表者名
      舒禹清, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Classification of causes of speech recognition errors using attention-based bidirectional long short-term memory and modulation spectrum2019

    • 著者名/発表者名
      Jennifer Santoso, Takeshi Yamada, Shoji Makino
    • 学会等名
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2019
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] BLSTMと変調スペクトルを用いた発話特徴識別の検討2019

    • 著者名/発表者名
      サントソ ジェニファー, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会2019年秋季研究発表会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] BLSTMを用いた音声認識誤り区間推定の検討2019

    • 著者名/発表者名
      舒禹清, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会2019年秋季研究発表会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Categorizing error causes related to utterance characteristics in speech recognition2019

    • 著者名/発表者名
      Jennifer Santoso, Takeshi Yamada, Shoji Makino
    • 学会等名
      RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing 2019 (NCSP'19)
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Novel speech recognition interface based on notification of utterance volume required in changing noisy environment2018

    • 著者名/発表者名
      Takahiro Goto, Takeshi Yamada, Shoji Makino
    • 学会等名
      RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing 2018 (NCSP'18)
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] 音声認識における誤認識原因通知のための印象評定値推定の検討2018

    • 著者名/発表者名
      後藤孝宏, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会2018年春季研究発表会
    • 関連する報告書
      2017 実施状況報告書

URL: 

公開日: 2017-04-28   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi