Project/Area Number |
22K12068
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Saitama University |
Principal Investigator |
島村 徹也 埼玉大学, 理工学研究科, 教授 (40235635)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
|
Keywords | 骨導音 / 気導音 / 基本周波数 |
Outline of Research at the Start |
本研究は、音声処理システムの質的向上および利用環境の拡大を目指し、従来未解決とされていた雑音環境下での音声の基本周波数の抽出問題に取り組み、気導音声と骨導音声の双方を利用することを検討し、3年間で実施するものである。雑音の特性と基本周波数抽出のための関数との関係性を気導音声および骨導音声の双方において明らかにし、雑音のタイプ毎に最良な基本周波数抽出方法を気導音声、骨導音声のそれぞれにおいて見出し、発展することで、雑音のタイプ毎に最良な基本周波数抽出方法を提示する。また、雑音のタイプ毎に、最も高精度な基本周波数抽出結果を与える気導音声・骨導音声組み合わせ法を導出し、その有効性を明らかにする。
|
Outline of Annual Research Achievements |
音声認識、話者認識においては、無雑音環境下においてほぼ100%に近い認識率を得るに至っている。しかしながら、実環境としての雑音環境下においては、認識率が大幅に低下してしまうことがよく知られている。一方、電話においても、駅や交差点など、高騒音を伴う環境では、情報を正確に伝達できない状況にある。従って、今後の音声処理システムの進展においては、雑音対策が極めて重要である。しかしながら、環境雑音は多種多用で、最近の先端的機械学習法を利用するとしても、全環境雑音を学習してしまうような考え方は非現実的と見なせる。現実的には、雑音下での音声分析の精度を向上し、その結果を雑音低減する方式(音声強調方式)等に適用し、音声認識、話者認識などの音声処理システムへ応用する方向性が、より大きな進展をもたらすと申請者は考える。このとき、重要な役割を果たすのが、音声の代表的な特徴量の基本周波数(あるいはその逆数であるピッチ)である。基本周波数が正確に抽出されることにより、音声強調を始め、多くの音声処理システムに利用可能であり、音声処理システムの質的向上へつながる。従って、これまで多くの基本周波数抽出方法が検討されてきたが、雑音環境下では抽出誤りが多く、また、雑音の特性によって抽出誤りが大きく左右されるという問題が残されていた。
本年度は、混入する雑音の特性を分析し、その基本周波数抽出へ及ぼす影響について検討を行った。基本周波数抽出法におうては、最近注目を集めている深層学習を用いた方法の実行精度の比較検討を行い、新たなネットワーク構成方法を見出した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
深層学習を用いる基本周波数抽出方法を実行し、確からしい結果を取得するまでに多くの時間を費やしてしまった。
|
Strategy for Future Research Activity |
深層学習に基づく基本周波数抽出方法に関して、特性改善が得られる工夫の方向性が明らかになってきたため、より多くの音声データを用い、実験結果を増やしていく。まずは、気導音声に対して実験を行っていくが、今後は特に、骨導音声の場合における結果を充実させていく予定である。
|