• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

雑音下における音声基本周波数抽出のための気導音、骨導音の利用に関する統合的研究

Research Project

Project/Area Number 22K12068
Research InstitutionSaitama University

Principal Investigator

島村 徹也  埼玉大学, 理工学研究科, 教授 (40235635)

Project Period (FY) 2022-04-01 – 2025-03-31
Keywords骨導音
Outline of Annual Research Achievements

音声認識、話者認識においては、無雑音環境下においてほぼ100%に近い認識率を得るに至っている。しかしながら、実環境としての雑音環境下においては、認識率が大幅に低下してしまうことがよく知られている。一方、電話においても、駅や交差点など、高騒音を伴う環境では、情報を正確に伝達できない状況にある。従って、今後の音声処理システムの進展においては、雑音対策が極めて重要である。しかしながら、環境雑音は多種多用で、最近の先端的機械学習法を利用するとしても、全環境雑音を学習してしまうような考え方は非現実的と見なせる。現実的には、雑音下での音声分析の精度を向上し、その結果を雑音低減する方式(音声強調方式)等に適用し、音声認識、話者認識などの音声処理システムへ応用する方向性が、より大きな進展をもたらすと申請者は考える。このとき、重要な役割を果たすのが、音声の代表的な特徴量の基本周波数(あるいはその逆数であるピッチ)である。基本周波数が正確に抽出されることにより、音声強調を始め、多くの音声処理システムに利用可能であり、音声処理システムの質的向上へつながる。従って、これまで多くの基本周波数抽出方法が検討されてきたが、雑音環境下では抽出誤りが多く、また、雑音の特性によって抽出誤りが大きく左右されるという問題が残されていた。

本年度は、混入する雑音の特性を分析し、その基本周波数抽出へ及ぼす影響について検討を行った。基本周波数抽出手法においては、フレーム処理に基づく従来手法に加え、最近注目を集めている深層学習を用いた方法の実行精度の比較検討を行った。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

本年度は、主として混入する各種雑音のパターンを分析し、そのパターン分類を検討する計画を立てていた。そのパターン分類自体に関しては、やや検討が不十分であるが、代わりに深層学習に基づく基本周波数抽出法に関して新たな知見が得られ、新しい基本周波数抽出法の実現に時間を費やした。

Strategy for Future Research Activity

深層学習に基づく基本周波数抽出法に関して新たな知見が得られたことで、新しい基本周波数抽出法の実現に向けて研究を進めていく。また並行して、混入する雑音の分析を行い、そのパターン分類の方法を検討する予定である。気導音声に対してまず検討を進めるが、骨導音声の場合における基本周波数抽出の結果の違いをさらに検討する予定である。

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi