誤認識原因の識別と通知に基づく音声認識のユーザビリティ改善

研究課題

研究課題/領域番号	17K00224
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
研究分野	知覚情報処理
研究機関	筑波大学
研究代表者	山田武志筑波大学, システム情報系, 准教授 (20312829)
研究期間 (年度)	2017-04-01 – 2020-03-31
研究課題ステータス	完了 (2019年度)
配分額 *注記	3,250千円 (直接経費: 2,500千円、間接経費: 750千円) 2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2018年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2017年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード	音声認識 / ユーザビリティ / 認識性能推定 / 誤認識原因識別 / 発話特徴 / 変調スペクトル / 認識率推定 / 雑音 / 発話様式 / 音声等認識 / 機械学習 / ユーザインターフェース
研究成果の概要	実利用における音声認識の性能はユーザの話し方によって大きく変動する。しかし、一般のユーザにとって、このような性能変動を的確に把握することは極めて難しい。そこで本研究では、ユーザが発話した音声を正しく認識できるか否かを判断し、認識できないと判断した場合には、その原因を識別してユーザに分かり易く通知する手法を開発した。まず、高精度な認識成否判断と誤認識原因識別を実現するために、変調スペクトルと深層ニューラルネットワークを用いた手法を提案し、その有効性を確認した。そして、誤認識原因をユーザに通知するためのインタフェースを設計してＰＣ上に実装した。
研究成果の学術的意義や社会的意義	本研究では、ユーザが発話した音声を正しく認識できるか否かを判断し、認識できないと判断した場合には、その原因を識別してユーザに分かり易く通知する手法を開発した。このような機能は本来ユーザインタフェースの一部として備わっているべきであるが、音声認識においてはこれまで実現していなかった。本研究成果により音声認識のユーザビリティが大きく改善し、音声認識サービスのさらなる普及につながると期待できる。また、本研究を通して既存の技術では認識が難しい音声特徴が明確になり、音声認識技術のさらなる高精度化を図るための指針を得た。

報告書

(4件)

研究成果
(7件)

すべて 2020 2019 2018

すべて学会発表 (7件) (うち国際学会 3件)

[学会発表] 発話の時間変動に着目した音声認識誤り区間推定の検討2020
- 著者名/発表者名
  舒禹清, 山田武志, 牧野昭二
- 学会等名
  日本音響学会2020年春季研究発表会
- 関連する報告書
  2019 実績報告書
[学会発表] Classification of causes of speech recognition errors using attention-based bidirectional long short-term memory and modulation spectrum2019
- 著者名/発表者名
  Jennifer Santoso, Takeshi Yamada, Shoji Makino
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2019
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] BLSTMと変調スペクトルを用いた発話特徴識別の検討2019
- 著者名/発表者名
  サントソジェニファー, 山田武志, 牧野昭二
- 学会等名
  日本音響学会2019年秋季研究発表会
- 関連する報告書
  2019 実績報告書
[学会発表] BLSTMを用いた音声認識誤り区間推定の検討2019
- 著者名/発表者名
  舒禹清, 山田武志, 牧野昭二
- 学会等名
  日本音響学会2019年秋季研究発表会
- 関連する報告書
  2019 実績報告書
[学会発表] Categorizing error causes related to utterance characteristics in speech recognition2019
- 著者名/発表者名
  Jennifer Santoso, Takeshi Yamada, Shoji Makino
- 学会等名
  RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing 2019 (NCSP'19)
- 関連する報告書
  2018 実施状況報告書
- 国際学会
[学会発表] Novel speech recognition interface based on notification of utterance volume required in changing noisy environment2018
- 著者名/発表者名
  Takahiro Goto, Takeshi Yamada, Shoji Makino
- 学会等名
  RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing 2018 (NCSP'18)
- 関連する報告書
  2017 実施状況報告書
- 国際学会
[学会発表] 音声認識における誤認識原因通知のための印象評定値推定の検討2018
- 著者名/発表者名
  後藤孝宏, 山田武志, 牧野昭二
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実施状況報告書

誤認識原因の識別と通知に基づく音声認識のユーザビリティ改善

研究代表者

山田 武志 筑波大学, システム情報系, 准教授 (20312829)

3,250千円 (直接経費: 2,500千円、間接経費: 750千円)

報告書

研究成果

[学会発表] 発話の時間変動に着目した音声認識誤り区間推定の検討2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Classification of causes of speech recognition errors using attention-based bidirectional long short-term memory and modulation spectrum2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] BLSTMと変調スペクトルを用いた発話特徴識別の検討2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] BLSTMを用いた音声認識誤り区間推定の検討2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Categorizing error causes related to utterance characteristics in speech recognition2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Novel speech recognition interface based on notification of utterance volume required in changing noisy environment2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音声認識における誤認識原因通知のための印象評定値推定の検討2018

著者名/発表者名

学会等名

関連する報告書

山田武志筑波大学, システム情報系, 准教授 (20312829)