研究課題/領域番号 |
19H04131
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 早稲田大学 (2020-2022) 筑波大学 (2019) |
研究代表者 |
牧野 昭二 早稲田大学, 理工学術院(情報生産システム研究科・センター), 特任教授 (60396190)
|
研究分担者 |
猿渡 洋 東京大学, 大学院情報理工学系研究科, 教授 (30324974)
山田 武志 筑波大学, システム情報系, 准教授 (20312829)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2021年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2020年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2019年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
|
キーワード | ブラインド音源分離 / 音響イベント検出 / 音情景解析 / 音響情報処理 |
研究開始時の研究の概要 |
1) バーチャルマイクロホン技術を発展させ、世界初の時間周波数ビームフォーマ技術および時間周波数S-VAD(Sophisticated Voice Activity Detector)技術を開発する。
2) 分散型マイクロホンアレーとバーチャルマイクロホンを融合させ、劣決定/優決定条件の全体を最適化した理論を構築する。
3) 音響イベント検出における弱ラベルによる学習法を開発し、ビッグデータのラベル付けコストの大幅削減を達成する。
|
研究成果の概要 |
昨今では、政府主導により超スマート社会の実現に向けた様々な取組みが行われている。マルチモーダルコミュニケーションの基盤技術の開発は、それらの問題解決の喫緊の課題である。応用範囲としてのスマートセキュリティ、高齢者見守り、ロボット聴覚、等への応用に関しては、いずれもマルチモーダルの根幹となる音環境を解析・理解するための統計数理、高速信号処理の基盤技術の確立が必要である。本研究は社会実装に向けた音環境を中心としたマルチモーダルコミュニケーションの基盤技術の開発である。具体的には、バーチャルマイクロホンや分散型マイクロホンアレーを用いた音響計測と深層学習による音環境の理解の基盤技術の研究を行った。
|
研究成果の学術的意義や社会的意義 |
本研究では、我々がこれまで提案してきたバーチャルマイクロホンという新概念に、音声や音響信号のパワフルな統計モデルや先進的な最適化手法を取り入れ、新しい分散型マイクロホンアレーシステムや信号処理アルゴリズムを開発したことに学術的意義がある。さらに、本研究では、マイクロホンアレー信号処理の積年の問題に立ち向かい、新しいロバストな分散型マイクロホンアレー信号処理アルゴリズムを考案し、包括的で安定な解法を開発したことに社会的意義がある。
|