Project/Area Number |
23K28113
|
Project/Area Number (Other) |
23H03423 (2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2023) |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Waseda University |
Principal Investigator |
牧野 昭二 早稲田大学, 理工学術院(情報生産システム研究科・センター), 特任教授 (60396190)
|
Co-Investigator(Kenkyū-buntansha) |
山田 武志 筑波大学, システム情報系, 教授 (20312829)
猿渡 洋 東京大学, 大学院情報理工学系研究科, 教授 (30324974)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥18,590,000 (Direct Cost: ¥14,300,000、Indirect Cost: ¥4,290,000)
Fiscal Year 2025: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Fiscal Year 2024: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Fiscal Year 2023: ¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
|
Keywords | 音響情報処理 / 音響信号処理 / マイクロホンアレー / 音環境の認識と理解 |
Outline of Research at the Start |
1) 音源分離・雑音抑圧・残響除去の統合技術を開発する。 2) 音源分離と時間周波数スイッチングフィルタを融合させ、劣決定/優決定条件の全体を最適化した理論を構築する。 3) 弱ラベル・ラベル無し学習法を開発し、ビッグデータのラベル付けコストの大幅削減を達成する。
|
Outline of Annual Research Achievements |
[検討項目1][音源分離・雑音抑圧・残響除去の統合および移動音源への対応] これまで異なるアプローチで個別に発展してきた音源分離・雑音抑圧・残響除去を同一の誤差関数の最小化問題として統合し、同時最適化する統合手法を開発した。そして、時間周波数スイッチングフィルタを用いたマイクロホンアレーに対応できるように一般化し、更に強力な最適化規範を導入した。今期は、雑誌論文4件、国際会議発表4件、および国内大会発表2件の研究成果を得た。 [検討項目2][時間周波数スイッチングフィルタの複素フィルタとしての新展開] 時間周波数スイッチングビームフォーマは、複素フィルタを用いてマイク間の位相差を制御して空間指向性を形成していた。この概念を音源分離・雑音抑圧・残響除去に展開した時間周波数スイッチングフィルタにより、音源数に依存することなく高品質な出力を得るための統一的なアレー信号処理を検討した。時間周波数スイッチングフィルタを音源分離・雑音抑圧・残響除去の統合手法と融合させ、優決定問題 (音源数 < マイク数) と劣決定問題 (マイク数 < 音源数) の両方に対応できる手法を構築した。今期は、雑誌論文2件および国際会議発表1件の研究成果を得た。 [検討項目3][音環境の理解およびユニバーサル・サウンド・セパレーション] ロボットの耳などを想定し、世界中にあるすべての音を対象とするユニバーサル・サウンド・セパレーションを検討した。強調された音源信号から抽出した特徴量に基づき、音環境を解析・理解した。分類精度を向上させるために、言語情報と音情報のマルチモーダルの活用法や敵対的生成ネットワーク(Generative Adversarial Networks: GAN)などの深層学習の最新の音声認識技術も検討した。今期は、国際会議発表2件および国内大会発表3件の研究成果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究は順調に進展し、雑誌論文6件、国際会議発表7件、国内大会発表5件の研究成果を得た。
|
Strategy for Future Research Activity |
[検討項目1][音源分離・雑音抑圧・残響除去の統合および移動音源への対応] これまで異なるアプローチで個別に発展してきた音源分離・雑音抑圧・残響除去を同一の誤差関数の最小化問題として統合し、同時最適化する統合手法を開発する。そして、時間周波数スイッチングフィルタを用いたマイクロホンアレーに対応できるように一般化し、更に強力な最適化規範を導入する。更に、演算量を削減しながら、性能を最適化するための実時間動作実現手法も検討する。 [検討項目2][時間周波数スイッチングフィルタの複素フィルタとしての新展開] 時間周波数スイッチングビームフォーマは、複素フィルタを用いてマイク間の位相差を制御して空間指向性を形成していた。この概念を音源分離・雑音抑圧・残響除去に展開した時間周波数スイッチングフィルタにより、音源数に依存することなく高品質な出力を得るための統一的なアレー信号処理を検討する。時間周波数スイッチングフィルタを音源分離・雑音抑圧・残響除去の統合手法と融合させ、優決定問題 (音源数 < マイク数) と劣決定問題 (マイク数 < 音源数) の両方に対応できる手法を構築する。 [検討項目3][音環境の理解およびユニバーサル・サウンド・セパレーション] ロボットの耳などを想定し、世界中にあるすべての音を対象とするユニバーサル・サウンド・セパレーションを検討する。強調された音源信号から抽出した特徴量に基づき、音環境を解析・理解する。音源信号に関する先見知識を利用し、音源の種類の増大に対処するため、言葉によるラベルを与えて補助する方式を検討する。特徴量次元での分類法も利用する。分類精度を向上させるために、言語情報と音情報のマルチモーダルの活用法や敵対的生成ネットワーク(Generative Adversarial Networks: GAN)などの深層学習の最新の音声認識技術も検討する。
|