研究課題/領域番号 |
19K21553
|
補助金の研究課題番号 |
18H06490 (2018)
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 (2019) 補助金 (2018) |
審査区分 |
1002:人間情報学、応用情報学およびその関連分野
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
坂東 宜昭 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (40828167)
|
研究期間 (年度) |
2018-08-24 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 音環境認識 / 音源分離 / 深層ベイズ学習 / 償却変分推論 / 音環境理解 |
研究開始時の研究の概要 |
雑踏環境でも頑健に動作する音環境理解システムを実現するため、深層学習とベイズ学習を統合した教師なし音源分離法を確立する。近年、深層学習に基づく分離法が高い性能を発揮しているが、膨大な音源信号の教師データを必要とし、音声や音楽信号の分離といった特定のタスクへの応用に留まっている。一方、空間モデルに基づく音源分離は事前学習せずに動作するが、同じ方向の音源を分離できない課題がある。そこで、これら2つの枠組みを統合し、教師データが少ない状況でも、分離された音源信号の空間的な尤もらしさに基づき音源分離を教師なし学習する枠組みを確立する。
|
研究成果の概要 |
本研究の目的は、単チャネル音源分離を教師データのない大量の多チャネル混合音信号から学習する枠組みを構築することである。マイクアレイで観測される音の空間情報に着目し、分離された音源信号の空間的な尤もらしさに基づき音源分離を教師なし学習する。まず、混合複素ガウスモデルの変分償却推論に基づく音源分離の深層ベイズ学習を確立した。さらに、視聴覚統合に基づく教師なし音源定位へ拡張し、拡散性雑音が存在し音源数が未知の雑踏環境でも動作する手法を開発した。
|
研究成果の学術的意義や社会的意義 |
従来の統計モデルの知見と、独立して研究されがちな近年の深層学習の知見を統合し、音源分離の教師なし学習の枠組みを実現した。これまで、深層学習に基づく音源分離には、個別の音源信号である正解データを大量に準備する必要があり、実世界の様々な音源を分離するには原理上限界があった。そこで、統計的信号処理で研究されてきたブラインド信号処理の知見を深層学習に導入することで、教師データを用いずとも音源分離を学習できる枠組みを実現した。
|