研究課題/領域番号 |
16H01735
|
研究機関 | 首都大学東京 |
研究代表者 |
小野 順貴 首都大学東京, システムデザイン研究科, 教授 (80334259)
|
研究分担者 |
牧野 昭二 筑波大学, システム情報系, 教授 (60396190)
猿渡 洋 東京大学, 大学院情報理工学系研究科, 教授 (30324974)
小山 翔一 東京大学, 大学院情報理工学系研究科, 講師 (80734459)
井本 桂右 立命館大学, 情報理工学部, 助教 (90802116)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 非同期 / 分散 / マイクロホンアレイ / 音源定位 / 音源分離 / 音響シーン認識 |
研究実績の概要 |
1) 非同期分散マイクロホンアレーを用いた音源分離、音源強調に関しては、マイク感度にばらつきがある状況でも、各音源を認識するのに最もよいマイクをブラインドで選択する手法を考案した。また、移動音源が存在する環境で、定常な時間フレームの自動検出に基づきサンプリング周波数ミスマッチをブラインド補償する新たな手法を開発した。2) ブラインド音源分離自体に関しては、国際会議ICASSP2018でチュートリアル講演を行った。また、ILRMAの一般化を進め、音源のローカルな分布がヘビーテイル分布やサブガウス分布の場合に拡張した。加えて、音源強調にブラインド音源分離を応用し、チェコのリベレツ工科大学と共同研究成果を発表した。3) 複数ビームフォーマを組み合わせた音声強調法に関しては、時間周波数bin毎のスイッチングビームフォーマという形に定式化し、劣決定条件での性能向上を確認した。4) 音源定位・マイク定位に関しては、我々が開発した定位手法を実環境での携帯端末の位置推定に応用し、ドイツのマックスプランク研究所と共同研究を行い、トップ会議Mobisys (2018年度の採択率は27%)に論文が採択された。5) 音響シーン認識への応用に関しては、実環境での録音を想定し、録音信号が間欠的に欠損している信号に対し、トピックモデルを用いたシーン認識法をまとめ、ジャーナル論文を出版した。6) 補聴器応用を目的に取り組んでいる低遅延実時間ブラインド音源分離を、国際会議ICASSP2018, IWAENC2018でデモ発表し、大きな関心を集めた。7) 実世界応用の一つとして、分散マイクで録音した音響信号から交通量を推定する交通量モニタリングへの応用研究を開始した。8) 音場再現への応用を想定し、音場の調和展開係数を解析的に求める理論を構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
学術的な成果として、ジャーナル論文2編(どちらも海外ジャーナル、うち2編はIEEE Trans.のトップジャーナル論文)、国際会議論文12編(うち5編は、ICASSP, EUSIPCO, Mobisysというトップ会議論文を含む)、国内学会発表10件という成果が得られた、APSIPA Best Paper Award、日本音響学会 学生優秀発表賞、音声研究会学生ポスター賞などを受賞した。研究としても国際的な波及をみせ、チェコのリベレツ工科大学、ドイツのマックスプランク研究所、エアランゲン大学と3件の異なる国際共同研究に発展した。また、トップ会議ICASSPでチュートリアル講演が採択され、ブラインド音源分離のチュートリアルを行った他、国内でも2件の招待講演を行った。この他、リオン株式会社の技術情報誌に、研究代表者小野のブラインド音源分離についてのインタビュー記事が掲載され、3月には3大学合同シンポジウムを開催し、多くの参加者を得た。以上のような、予定を超える大きな成果が得られたため。
|
今後の研究の推進方策 |
現状、大変順調に進展しているため、当初の計画から大きな変更の必要はないと考える。今後は特に理論面では、ブラインド同期法の高速化を検討する他、ブラインド音源分離の音源モデルの精緻化、アルゴリズムの高速化、低遅延化についても引き続き進める。また、自動議事録作成、補聴器、交通量モニタリングなど、さまざまに展開をみせている実世界応用についても研究を進める。
|