2015 Fiscal Year Research-status Report
気導音声と骨導音声を同時利用する基本周波数抽出法の確立とその話者認識への応用
Project/Area Number |
26330187
|
Research Institution | Saitama University |
Principal Investigator |
島村 徹也 埼玉大学, 情報メディア基盤センター, 教授 (40235635)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 骨伝導 |
Outline of Annual Research Achievements |
個人認証のために、音声の個人差を用いて誰の声であるかを自動的に判定する技術は特に話者認識と呼ばれ、これまでの研究で無雑音環境下においては、理想状態に近いレベルまで達していることが知られている。しかしながら、実環境としての雑音環境下においては、認識率が大幅に低下してしまうことがよくある。そこで、雑音付加音声に雑音低減を施し、信号対雑音比(SNR)を改善する方法や、雑音にも強靱な話者の特徴パラメータの利用、音声の変動を表現する統計モデルの工夫、などが検討されている。しかしながら、確約されるアルゴリズムが存在していない。 申請者の研究室では、広い意味での音声情報処理システムへの応用を念頭にこれまで音声処理の研究を進めてきた。特に、実システムとしての利用を目的としたときの雑音環境下での音声処理の重要性を考慮し、雑音環境下での音声特徴パラメータの抽出及び雑音付加音声中の音声のみの強調の問題(音声強調)に着手してきた。最近では、特に後者とも関連し、特殊なマイクロホンを利用することにより、雑音環境下、特には高騒音環境下においてさえも高いSNRが確保できることから、骨伝導マイクロホン(骨導マイクロホン)の利用に着目してきた。本研究での申請は、この骨導マイクロホンから収録された音声、骨導音声、を利用し、高精度な基本周波数抽出を図り、話者認識への応用に努めるものである。 本年度は、骨導音声の基本周波数と気導音声の基本周波数の比較検討を行い、両者はほぼ同じ特性を有することを明らかにした。そして、骨導音声の基本周波数を気導音声の気導音声の基本周波数の真値として利用できることを明らかにし、新しい基本周波数データ取得の方法を示した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本年度は、骨導音声の基本周波数と気導音声の基本周波数の比較検討をさらに行い、両者はほぼ同じ特性を有することを明らかにした。そして、骨導音声の基本周波数を気導音声の気導音声の基本周波数の真値として利用できることを明らかにし、従来とは異なる方向から、新しい基本周波数データ取得の方法を示した。また、この研究の過程で気導音声の低周波数部分と骨導音声の低周波数部分を入れ替えることにより、新しい骨導音声の品質改善法を導出することに成功した。これらの研究に多くの時間を費やすこととなり、話者認識アルゴリズム構築の計画を立てていたが、そこまでには至っていない。
|
Strategy for Future Research Activity |
今年度、気導音声と骨導音声を併用する、新しい骨導音声の品質改善方法を導出することができた。この方法のパラメータ設定の検討をさらに行う予定である。また、本研究の過程で気づいた、雑音が混入する場合での骨導音声の品質改善方法にも着手しつつ、骨導音声からの基本周波数抽出の方法を確立して行く。そしてその結果を、話者認識アルゴリズムの構築へと繋げて行く予定である。
|
Research Products
(3 results)