研究課題/領域番号 |
19700172
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 大同大学 |
研究代表者 |
柘植 覚 大同大学, 情報学部, 准教授 (00325250)
|
研究期間 (年度) |
2007 – 2010
|
研究課題ステータス |
完了 (2010年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,300千円、間接経費: 600千円)
2010年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2009年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2008年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2007年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 特定話者 / 話者内音声変動 / 音声認識 / 音声分析 / 特定話者の話者内音声変動 / 音声変動 |
研究概要 |
同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならない。このような音声認識結果の異なりは、「さっき認識したのに、なんで今回認識しないのだろう?」というような音声認識システムへの不信感につながり、音声認識が広く一般に普及しない原因の一つとなっている。音声は個人性により大きく変動することもさることながら、個々人が同一内容を発声したとしても、気分や発声環境により変動(音声変動)する。これが認識結果の変動を引き起こす原因となっている。 本研究では、特定話者ならば長期間に渡り、安定した高精度の音声認識ができる音声認識手法の確立を目標とする。申請期間において、科学的側面から特定話者(個々人)の音声が時期、時間、体調、気分、環境などの違いでどのように変動するかを明確にし、これらの音声変動に頑健な特定話者音声認識手法を確立する。
|