研究課題/領域番号 |
22K12922
|
研究機関 | 九州工業大学 |
研究代表者 |
水町 光徳 九州工業大学, 大学院工学研究院, 教授 (90380740)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 次世代補聴 / 雑音除去 / ビームフォーミング / ニューラルネットワーク / ステレオ音像幅 / 知覚的最適化 / 雑音下での発話と音知覚の相互作用 |
研究実績の概要 |
本研究課題は、次世代補聴システムの構築にあたり、高精度の音源分離と適切な音呈示方式の確立を目指す。音源分離に関しては、小型マイクロホンアレーを用いて、特定方向から到来する音信号のみを強調するための非線形ビームフォーマを構築した。非線形ビームフォーマは、ニューラルネットワークを用いて空間フィルタを最適化することにより、目的音源方向に鋭い指向特性を形成する。一方、音呈示方式では、非線形ビームフォーマを用いて抽出した目的信号を、音の到来方向や音像を含めて、知覚的に適切に呈示することを目指す。 令和5年度は、非線形ビームフォーマで使用する長・短期記憶(Long Short-Term Memory: LSTM)の各種パラメータの最適化を行い、250 Hzから8 kHzまでの広帯域における非線形ビームフォーマの指向性先鋭化を実現した。音呈示方式については、ステレオ音源のチャネル間相互相関と知覚的なステレオ音像幅との関係を多面的に検討した。様々なジャンルのステレオ音源のチャネル間相互相関を周波数帯域ごとに分析した結果、各周波数帯域におけるステレオ音像幅が、我々の聴知覚特性の周波数依存性と密接に関連していることがわかった。また、雑音下での音呈示と音知覚の関係をより深く理解するために、雑音下での発話と音知覚の相互作用についても検討した。従来の研究では雑音の周波数特徴に基づく議論が多いが、本研究は、雑音と発話音声の時間特徴に着目する。令和5年度は、雑音下での発話音声の時間包絡の強調が、音声分離に寄与する興味深い知見を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
非線形ビームフォーミングに関しては、音声帯域をカバーする広帯域最適化を実現した。これにより、本研究の目標である実環境補聴の収音技術を確立した。ステレオ音像幅制御に関しては、令和4年度より継続して、多大なコストが必要となる聴取実験の代替として、チャネル間相互相関に基づく新たなパラメータ最適化方法の妥当性について検証した。 令和5年度には、雑音下での発話と音知覚の相互作用についても検討し、より現実的な問題設定での補聴の在り方について検討を開始した。
|
今後の研究の推進方策 |
非線形ビームフォーマの雑音除去性能を定量的に評価する。その過程において、指向性の先鋭化と目的信号に生じる非線形歪みの関係を明らかにする。雑音除去音声の呈示については、令和5年度に検討した雑音下での発話と音知覚の相互作用も考慮し、信号処理と知覚的観点の両面から、知覚的音像幅と雑音環境下での音知覚の関係を検討する。
|
次年度使用額が生じた理由 |
ステレオ音源の知覚的音像幅の適切な制御方法を検討するために、多数の実験参加者の協力を得て聴取実験を実施する予定であった。令和4年度及び令和5年度の研究成果により、これまでに実施した聴取実験の結果を活用し、ステレオ音源の左右チャネル間相互相関に基づく知覚的音像幅の最適化方式を見出した。そのため、聴取実験の実施にかかる経費を節約することができた。当該経費は、研究成果発表のための旅費及び学会参加費として活用する。
|