• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

気導音声と骨導音声を同時利用する基本周波数抽出法の確立とその話者認識への応用

Research Project

Project/Area Number 26330187
Research InstitutionSaitama University

Principal Investigator

島村 徹也  埼玉大学, 情報メディア基盤センター, 教授 (40235635)

Project Period (FY) 2014-04-01 – 2017-03-31
Keywords骨伝導
Outline of Annual Research Achievements

個人認証のために、音声の個人差を用いて誰の声であるかを自動的に判定する技術は特に話者認識と呼ばれ、これまでの研究で無雑音環境下においては、理想状態に近いレベルまで達していることが知られている。しかしながら、実環境としての雑音環境下においては、認識率が大幅に低下してしまうことがよくある。そこで、雑音付加音声に雑音低減を施し、信号対雑音比(SNR)を改善する方法や、雑音にも強靱な話者の特徴パラメータの利用、音声の変動を表現する統計モデルの工夫、などが検討されている。しかしながら、確約されるアルゴリズムが存在していない。
申請者の研究室では、広い意味での音声情報処理システムへの応用を念頭にこれまで音声処理の研究を進めてきた。特に、実システムとしての利用を目的としたときの雑音環境下での音声処理の重要性を考慮し、雑音環境下での音声特徴パラメータの抽出及び雑音付加音声中の音声のみの強調の問題(音声強調)に着手してきた。最近では、特に後者とも関連し、特殊なマイクロホンを利用することにより、雑音環境下、特には高騒音環境下においてさえも高いSNRが確保できることから、骨伝導マイクロホン(骨導マイクロホン)の利用に着目してきた。本研究での申請は、この骨導マイクロホンから収録された音声、骨導音声、を利用し、高精度な基本周波数抽出を図り、話者認識への応用に努めるものである。
本年度は、音素バランスを考慮して、市販されているデータベースの発声内容と同じ気導音声・骨導音声のペアのデータベースを構築した。そして、骨導音声のみを用いた基本周波数抽出を行い、気導音声のみを用いた場合との比較検討を行った。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

今年度は、骨導音声を含む音声データベースが存在しないことから、音素バランスを考慮して、市販されているデータベースの発声内容と同じ気導音声・骨導音声のペアのデータベースを構築することから始めた。男女合わせて50人分の音声データを集めることを目標にしていたが、他機関からの協力も得られ、予想よりも大規模なデータベースを準備することに成功した。また一方で、骨導音声の基本周波数抽出に取り組んだ。気導音声の基本周波数と骨導音声の基本周波数の類似性と相違性を検討し、ある程度の実験結果がまとまった。また、基本周波数抽出の観点から双方の性質を比較検討し、骨導音声を利用することで、雑音環境下の場合には、かなり優位となる事実を明らかにできた。しかしながら、この研究の段階で、これまで着手してきた方法とは異なる観点から、骨導音声の品質改善を得る新たなアルゴリズムの導出に成功し、その実験的検証を行うことにした。ここに多くの時間を費やすこととなり、気導音声と骨導音声を併用しながら、新たな基本周波数抽出のアルゴリズム導出の計画を立てていたが、そこまでは至っていない。

Strategy for Future Research Activity

今年度、気導音声と骨導音声の低周波数成分の分析に注力したことで、気導音声の低周波数部分と気導音声の低周波数部分を入れ替えることにより、新しい骨導音声の品質改善法が見出された。まずこの方法の実験的検証を行い、結果をまとめる予定である。その後、基本周波数抽出アルゴリズムの確立、そして、話者認識アルゴリズムへの発展と繋げて行く予定である。

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi