2008 Fiscal Year Annual Research Report
時期差・時間差・気分による音声変動の解明と分散型話者認識への応用に関する研究
Project/Area Number |
17300065
|
Research Institution | Chiba University |
Principal Investigator |
黒岩 眞吾 Chiba University, 大学院・融合科学研究科, 教授 (20333510)
|
Co-Investigator(Kenkyū-buntansha) |
柘植 覚 徳島大学, 大学院・ソシオテクノサイエンス研究部, 講師 (00325250)
西田 昌史 千葉大学, 大学院・融合科学研究科, 助教 (80361442)
|
Keywords | 音声学 / 音声データベース / 話者認識 / 話者識別 / 話者照合 / 分散型話者認識 / 分散型話者照合 / 音声変動 |
Research Abstract |
(1)小数話者、長・短期間音声データベースの構築週1日、朝昼夕の3回、音素バランス文5O文及び単語等を1名の話者が発声した音声を収録した(今後も続ける)。また、前年度までに収録した音声データの聞き直し、及び切り出しを行いデータベース化を進めた。現在、データベースの一部を国立情報学研究所を通じ公開するための準備を進めている。 (2)特徴空間上での話者性・音韻性・時期差の線形分離手法の検討主成分分析に基づく特徴空間の線形分離手法を考案し、上記(1)で収集したデータ及び科学警察研究所において収録された話者認識評価用データベースを用い、話者性・音韻性・時期差の分離を試みた。実験の結果、音韻性を除去した空間のテキスト非依存話者認識で従来よりも高い性能を達成した。また、時期差を除去する小規模な実験も行い提案手法の有効性を確認した。 (3)時期差・時間差・気分による音声変化の分析上記(1)で収集したデータで学習した音響モデルを用いた音声認識実験により音声認識率と時期差の関係を調査した。また、周囲の環境差により話者認識率が極端に低下することも明らかとなった。 (4)分散型話者照合手法の研究開発と高速化従来のスコア正規化手法に替わる、順位を用いた話者照合手法を考案し、従来よりも高い照合性能を達成すると共に、時期差に対する安定性を確認した。また、同手法において事前の話者クラスタリングを考案し、実験を通じ照合時の計算時間を8分の1に低減できることを確認した。さらに、骨導音声と気道音声の両方の音声を用いた話者認識精度向上手法を考案し、実験によりその有効性を確認した。
|