研究課題/領域番号 |
16H01735
|
研究機関 | 首都大学東京 |
研究代表者 |
小野 順貴 首都大学東京, システムデザイン研究科, 教授 (80334259)
|
研究分担者 |
牧野 昭二 筑波大学, システム情報系, 教授 (60396190)
猿渡 洋 東京大学, 大学院情報理工学系研究科, 教授 (30324974)
小山 翔一 東京大学, 大学院情報理工学系研究科, 講師 (80734459)
越智 景子 東京工科大学, メディア学部, 助教 (20623713)
井本 桂右 立命館大学, 情報理工学部, 助教 (90802116)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 非同期 / 分散 / マイクアレー / 音源定位 / 音源分離 / 音響シーン認識 |
研究実績の概要 |
1) 非同期分散マイクロホンアレーを用いた音源分離、音源強調に関しては、まず、同期のための教師信号を用いて非同期分散マイクを同期させ、音源分離を行う手法についてとりまとめ、ジャーナル論文を出版した。また、伝達関数ゲインNMFを用い、複数の遠方雑音をひとまとめにして抑圧する手法についてもジャーナル論文を出版し、論文賞を受賞した。また、実世界応用を想定し、実環境複数人会話音声の評価を行い、非同期分散マイクを用いることによる性能向上を確認した。2) ブラインド音源分離自体に関しては、まず、ICA, IVA, ILRMAに統一的に応用可能な、分離行列の高速推定法を発見した。さらに、ILRMAについては複素t分布やIダイバージェンスの適用について検討した他、DNNを用いた音源モデルを導入したIDLMAを開発した。3) マイクロホンアレー自体の性能向上を目指して取り組んでいるバーチャルマイクロホンを用いた音声強調法に関しては、残響環境で評価するとともに、複数ビームフォーマを組み合わせる新たな手法に発展させた。4) 音源定位・マイク定位に関しては、到来時間差行列について従来知られていなかった新たなランク制約を発見し、これにより、観測された到来時間差行列の雑音を低減する手法を開発した。5) 音響シーン認識、音響イベント検出への応用に関しては、分散マイクを活用した空間ケプストラム法のジャーナル論文を出版し、論文賞を受賞した。また、こうした空間情報を「音響空間ワード」として扱う生成モデルベースのシーン認識法を開発した他、各マイクの録音長が大きく違う場合の活用法も考案した。6) 実世界応用の一つとして補聴器への応用について取り組み、低遅延の実時間ブラインド音源分離を実現した。7) 音場再現への応用を想定し、無限次元調和解析に基づく音場を補間する新たな理論を構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
学術的な成果として、ジャーナル論文4編(うち2編はIEEE Trans.のトップジャーナル論文)、国際会議論文11編(うち7編は、MLSP, MMSP, EUSIPCOトップ会議論文)、国内学会発表13件という大きな成果が得られた他、日本音響学会論文賞佐藤賞、電気通信普及財団テレコムシステム技術賞奨励賞2件、計3件の学会賞を受賞したため。
|
今後の研究の推進方策 |
現状、大変順調に進展しているため、当初の計画から大きな変更の必要はないと考える。今後は特に、複数話者同時音声認識の評価を引き続き進めるとともに、ブラインド同期の適用範囲を広げ、移動音源が存在する環境下でも手法を検討する。また、ブラインド音源分離の音源モデルの精緻化、アルゴリズムの高速化、低遅延化についても引き続き進める。
|