研究課題/領域番号 |
17K00224
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 筑波大学 |
研究代表者 |
山田 武志 筑波大学, システム情報系, 准教授 (20312829)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2017年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 音声認識 / ユーザビリティ / 認識性能推定 / 誤認識原因識別 / 発話特徴 / 変調スペクトル / 認識率推定 / 雑音 / 発話様式 / 音声等認識 / 機械学習 / ユーザインターフェース |
研究成果の概要 |
実利用における音声認識の性能はユーザの話し方によって大きく変動する。しかし、一般のユーザにとって、このような性能変動を的確に把握することは極めて難しい。そこで本研究では、ユーザが発話した音声を正しく認識できるか否かを判断し、認識できないと判断した場合には、その原因を識別してユーザに分かり易く通知する手法を開発した。まず、高精度な認識成否判断と誤認識原因識別を実現するために、変調スペクトルと深層ニューラルネットワークを用いた手法を提案し、その有効性を確認した。そして、誤認識原因をユーザに通知するためのインタフェースを設計してPC上に実装した。
|
研究成果の学術的意義や社会的意義 |
本研究では、ユーザが発話した音声を正しく認識できるか否かを判断し、認識できないと判断した場合には、その原因を識別してユーザに分かり易く通知する手法を開発した。このような機能は本来ユーザインタフェースの一部として備わっているべきであるが、音声認識においてはこれまで実現していなかった。本研究成果により音声認識のユーザビリティが大きく改善し、音声認識サービスのさらなる普及につながると期待できる。また、本研究を通して既存の技術では認識が難しい音声特徴が明確になり、音声認識技術のさらなる高精度化を図るための指針を得た。
|