2005 Fiscal Year Annual Research Report
時期差・時間差・気分による音声変動の解明と分散型話者認識への応用に関する研究
Project/Area Number |
17300065
|
Research Institution | The University of Tokushima |
Principal Investigator |
黒岩 眞吾 徳島大学, 工学部, 助教授 (20333510)
|
Co-Investigator(Kenkyū-buntansha) |
北 研二 徳島大学, 高度情報化基盤センター, 教授 (10243734)
任 福継 徳島大学, 工学部, 教授 (20264947)
柘植 覚 徳島大学, 工学部, 講師 (00325250)
|
Keywords | 音声学 / 音声データベース / 話者認識 / 話者識別 / 話者照合 / 分散型話者認識 / 分散型話者照合 / 音声変動 |
Research Abstract |
データベース収集に関わる研究開発、収集したデータの分析を行うための手法の研究、分散型話者認識手法の研究開発を行った。研究項目毎の研究実績の概要を以下に示す。 (1)朝昼晩音声データの収集と音声データベースの構築 週1日、朝昼晩の3回、音素バランス文50文を4名の話者が簡易防音室内で発声した音声を収録した。また,データベース化を効率よく行うために,音声認識を利用した半自動ファイリングシステムを開発した。これにより,従来の約3分の1の時間でデータベース化が可能となった。現在までに,女性1名の3年分のデータについて、データベース化を終了した。 (2)時期差・時間差・気分による音声変化の分析 収集した音声データベースのうち,女性話者1名のデータを用い発声回毎に音響モデルを作成し音声認識実験を行うことで、時期差・時間差・気分等の要因が認識率に与える影響を調査した。また,COSMOS法を導入し音響モデル空間の観測を行った。これらより,風邪などの明らかな差異の抽出は可能となったが,認識率に直接影響を与える要因の特定には至っておらず来年度も研究を続ける。 (3)分散型話者認識手法の研究開発 情報圧縮に頑健な話者認識手法としてEarth Mover's Distance(EMD)とベクトル量子化を統合したノンパラメトリックな話者認識手法を開発した。また、音素毎の話者識別性能を検討した結果,音素の種類及び登録時の学習データ量に応じ,認識に用いる音声データを取捨選択することでより高い認識精度が達成できることを確認した。 (4)音声言語情報からの感性情報抽出法の研究開発 40名程度の被験者に対し,書き起こしテキストを用い、テキストデータからの感情抽出実験を行った。また,現在の心的状態によって,同じ事象が生じた場合でも,その結果生じる状態が異なることもモデル化可能な心的状態遷移ネットワークを開発した。
|