研究課題/領域番号 |
20K11880
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 筑波大学 |
研究代表者 |
山田 武志 筑波大学, システム情報系, 教授 (20312829)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 音響シーン識別 / 空間アテンション機構 / ビームフォーマ / 空間フィルタ / ニューラルネットワーク / 損失関数 / 空間信号処理 / 音響イベント検出 / マイクロホンアレー / 空間情報 / アテンション機構 |
研究開始時の研究の概要 |
音響シーン識別において複数のマイクの録音信号を入力することにより、個々の音源の方向などの空間特徴を活用することが可能となり、識別性能のさらなる向上が期待できる。本研究の目的は、空間信号処理と識別器の融合による新しい音響シーン識別手法を確立することである。具体的には、音響シーンに存在する複数の音源の中からより重要な音源に自動的に焦点を当てる機能(空間アテンション機構)を有するニューラルネットワークを新たに開発する。
|
研究成果の概要 |
本研究では、ビームフォーマを前処理として用いる音響シーン識別手法の性能を改善するために、音響シーンに存在する複数の音の中から注目すべき音(識別に有用な音)に自動的に焦点を当てる空間アテンション機構という新しいアイデアを導入した。その実現のために、複数の空間フィルタ出力への自動重み付けに基づく識別手法、及びその拡張である空間フィルタの自動推定に基づく識別手法を提案し、実験によりその有効性を示した。
|
研究成果の学術的意義や社会的意義 |
本研究成果の学術的独自性と創造性は、空間アテンション機構という新しいアイデアを実現した点にある。これにより、目的音方向などの事前情報を必要とせず、注目すべき音がどの音なのかを自動的に見つけると共に、それを強調するための空間フィルタを自動推定することが可能となった。これは信号処理技術と識別技術の有機的な統合によって成し得たものであり、音響シーン識別のみならず、雑音下音声認識などの他の様々なタスクへの展開が期待できる。
|