研究課題/領域番号 |
15700163
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 徳島大学 |
研究代表者 |
柘植 覚 徳島大学, 工学部, 講師 (00325250)
|
研究期間 (年度) |
2003 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
2,700千円 (直接経費: 2,700千円)
2005年度: 500千円 (直接経費: 500千円)
2004年度: 900千円 (直接経費: 900千円)
2003年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 音声認識 / 低音声認識精度発声 / 相関分析 / 音声認識精度の分析 / 長短期間の音声変動 / 分散型音声認識 / 分散型話者認識 / Earth Mover's Distance / ベクトル量子化 / 周波数特性の変動 |
研究概要 |
本研究の研究の目的は以下の2点である. ◆低認識精度発声の原因解明 ◆低認識精度発声の認識精度向上 この目的を実現するために、次のことを実施した。 原因解明のため、現在定期的に収録を行っている特定話者長期間音声データベースを用い、様々な要因との相関分析を行った。この結果より、特定話者の場合、発話速度は音声認識精度への相関が低いことがわかった。これは、発話速度は置換誤りと相関が低いが、挿入誤りとは高い負の相関を持ち、脱落誤りとは高い正の相関を持つため、挿入誤りと脱落誤りが相殺し、発話速度と音声認識精度の相関が低いことがわかった。また、音声認識精度と母音の各正解率との相関をしらべ、母音/a/、/u/は音声認識精度との相関が高いことがわかった。 低認識精度発声の認識精度向上のため、原因解明のために使用したデータと同様のデータを使用して、認識精度向上のため、各発声日、発声時間帯に音響モデルを適応することを試みた。これは、認識率改善のためには、一日内の音声変動が有効化、同じ時間帯の音声が有効化を検討した。この検討の結果、音声認識精度改善のためには同一内に発声された音声を用い、音響モデルを適応することが有効であることがわかった。
|