2007 Fiscal Year Annual Research Report
時期差・時間差・気分による音声変動の解明と分散型話者認識への応用に関する研究
Project/Area Number |
17300065
|
Research Institution | Chiba University |
Principal Investigator |
黒岩 眞吾 Chiba University, 大学院・融合科学研究科, 教授 (20333510)
|
Co-Investigator(Kenkyū-buntansha) |
北 研二 徳島大学, 高度情報化基盤センター, 教授 (10243734)
柘植 覚 徳島大学, 大学院・ソシオテクノサイエンス研究部, 講師 (00325250)
|
Keywords | 音声学 / 音声データベース / 話者認識 / 話者識別 / 話者照合 / 分散型話者認識 / 分散型話者照合 / 音声変動 |
Research Abstract |
音声データの収集と音声データベースの構築 週1日、朝昼晩の3回、音素バランス文50文を男性3名の話者が発声した音声を収録した(うち2名は今年度で終了)。同データを半自動でデータベース化するためのツールを開発・改良した。また、科学警察研究所において収集された音声データを変換し本研究で利用するための環境を整えた。来年度は開発したツールを利用し,本年度までに収録データのラベリングを行いデータベース化を進める。 時期差・時間差・気分による音声変化の分析 上記(1)で収集した音声データベースを用い音響モデルを作成し,音声認識実験および話者認識実験を通じ,時期差・時間差・気分等の要因が認識率に与える影響を調査した。 話者認識に有効な特徴量・音素の同定 昨年度,英語において有効だった音素依存の話者認識手法が,(1)で作成した日本語音声データベースに対し十分な性能が得られない場合があることが判明し,その原因を調査した。来年度,改良手法を提案予定である。(5)感情状態遷移ネットワークの研究 人の気分をモデル化するために,人間の感情を内的状態と外部刺激により確率的に遷移するネットワークを数百名のアンケート調査に基づき構築した。(本項目は本年度で終了) 分散型話者照合手法の研究開発と高速化 多数話者のモデルを利用した閾値自動設定手法を開発し,高精度話者照合手法を確立した。一方,高速化としてErathMover's Distanceの高速化手法を開発し,パラメータ数が64程度のモデルでは高速化を達成できたが,パラメータ数が256を超えるモデルでは僅かな速度向上に留まった。来年度はパラメータ数が多いモデルでも実用的な時間で話者照合を可能とする手法を開発する。
|