2016 Fiscal Year Annual Research Report
Fundamental Frequency Detection Utilizing Air and Bone Conducted Speeches and Its Application to Speaker Recognition
Project/Area Number |
26330187
|
Research Institution | Saitama University |
Principal Investigator |
島村 徹也 埼玉大学, 情報メディア基盤センター, 教授 (40235635)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 骨伝導 |
Outline of Annual Research Achievements |
個人認証のために、音声の個人差を用いて誰の声であるかを自動的に判定する技術は特に話者認識と呼ばれ、これまでの研究で無雑音環境下においては、理想状態に近いレベルまで達していることが知られている。しかしながら、実環境としての雑音環境下においては、認識率が50%以下になるなど大幅に低下してしまうことがよくある。そこで、雑音付加音声に雑音低減を施し、信号対雑音比(SNR)を改善する方法や、雑音にも強靱な話者の特徴パラメータの利用、音声の変動を表現する統計モデルの工夫、などが検討されている。しかしながら、確約されるアルゴリズムが存在していない。
申請者の研究室では、広い意味での音声情報処理システムへの応用を念頭にこれまで音声処理の研究を進めてきた。特に、実システムとしての利用を目的としたときの雑音環境下での音声処理の重要性を考慮し、雑音環境下での音声特徴パラメータの抽出及び雑音付加音声中の音声のみの強調の問題(音声強調)に着手してきた。最近では、特に後者とも関連し、特殊なマイクロホンを利用することにより、雑音環境下、特には高騒音環境下においてさえも高いSNRが確保できることから、骨伝導マイクロホン(骨導マイクロホン)の利用に着目してきた。本研究での申請は、この骨導マイクロホンから収録された音声、骨導音声、を利用し、高精度な基本周波数抽出を図り、話者認識への応用に努めるものである。
本年度は、気導音声と骨導音声を併用する、新しい基本周波数の抽出方法を導出することができた。また、骨導音声にわずかに混入する雑音も考慮して、骨導音声の品質改善を行う方法を導出することができた。
|
Research Products
(4 results)