• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

雑音下における音声基本周波数抽出のための気導音、骨導音の利用に関する統合的研究

研究課題

研究課題/領域番号 22K12068
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関埼玉大学

研究代表者

島村 徹也  埼玉大学, 理工学研究科, 教授 (40235635)

研究期間 (年度) 2022-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード骨導音 / 気導音 / 基本周波数
研究開始時の研究の概要

本研究は、音声処理システムの質的向上および利用環境の拡大を目指し、従来未解決とされていた雑音環境下での音声の基本周波数の抽出問題に取り組み、気導音声と骨導音声の双方を利用することを検討し、3年間で実施するものである。雑音の特性と基本周波数抽出のための関数との関係性を気導音声および骨導音声の双方において明らかにし、雑音のタイプ毎に最良な基本周波数抽出方法を気導音声、骨導音声のそれぞれにおいて見出し、発展することで、雑音のタイプ毎に最良な基本周波数抽出方法を提示する。また、雑音のタイプ毎に、最も高精度な基本周波数抽出結果を与える気導音声・骨導音声組み合わせ法を導出し、その有効性を明らかにする。

研究実績の概要

音声認識、話者認識においては、無雑音環境下においてほぼ100%に近い認識率を得るに至っている。しかしながら、実環境としての雑音環境下においては、認識率が大幅に低下してしまうことがよく知られている。一方、電話においても、駅や交差点など、高騒音を伴う環境では、情報を正確に伝達できない状況にある。従って、今後の音声処理システムの進展においては、雑音対策が極めて重要である。しかしながら、環境雑音は多種多用で、最近の先端的機械学習法を利用するとしても、全環境雑音を学習してしまうような考え方は非現実的と見なせる。現実的には、雑音下での音声分析の精度を向上し、その結果を雑音低減する方式(音声強調方式)等に適用し、音声認識、話者認識などの音声処理システムへ応用する方向性が、より大きな進展をもたらすと申請者は考える。このとき、重要な役割を果たすのが、音声の代表的な特徴量の基本周波数(あるいはその逆数であるピッチ)である。基本周波数が正確に抽出されることにより、音声強調を始め、多くの音声処理システムに利用可能であり、音声処理システムの質的向上へつながる。従って、これまで多くの基本周波数抽出方法が検討されてきたが、雑音環境下では抽出誤りが多く、また、雑音の特性によって抽出誤りが大きく左右されるという問題が残されていた。

本年度は、混入する雑音の特性を分析し、その基本周波数抽出へ及ぼす影響について検討を行った。基本周波数抽出法におうては、最近注目を集めている深層学習を用いた方法の実行精度の比較検討を行い、新たなネットワーク構成方法を見出した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

深層学習を用いる基本周波数抽出方法を実行し、確からしい結果を取得するまでに多くの時間を費やしてしまった。

今後の研究の推進方策

深層学習に基づく基本周波数抽出方法に関して、特性改善が得られる工夫の方向性が明らかになってきたため、より多くの音声データを用い、実験結果を増やしていく。まずは、気導音声に対して実験を行っていくが、今後は特に、骨導音声の場合における結果を充実させていく予定である。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi