2004 Fiscal Year Annual Research Report
パルスニューラルネットワークによる複数音源自動分離学習ネットワークの構築
Project/Area Number |
16700205
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
黒柳 奨 名古屋工業大学, 工学研究科, 助手 (10283475)
|
Keywords | 聴覚情報処理システム / 音源認識 / 複数音源分離 / ニューラルネットワーク / パルスニューラルネットワーク / 教師なし学習 / CASA / SOM |
Research Abstract |
自律行動ロボットが外界を認知する手法を考えた場合、聴覚センサは全方位からの情報を効率よく獲得できるため、ロボットの環境把握のためにはなくてはならない手法である。このような聴覚システムを実現するためにはロボットが遭遇するであろう音源の種類をあらかじめ選択、記憶させておく必要がある。しかし自律行動ロボットの活躍範囲が拡大している昨今においては、ロボット行動範囲を限定してあらかじめ特定の音を記憶させることは妥当ではない。そこで、本研究では自律ロボットのための汎用的な聴覚システムを構築し、ロボットがその活躍の場において発生する音の種類を各個に学習することをめざし、環境に適応して周囲に存在する複数の音の種類を分離して学習分類する聴覚システムの実現を行った。3年計画の初年度として、本年度は入力信号の立ち上がり情報に着目して複数音源の分離学習を行った。学習手法としては、我々により既に提案されているパルスニューラルネットワークを用いた教師なし学習ネットワークCONPの拡張を行った。CONPの前段に音の立ち上がりに特異的に反応するアクティブフィルタを配置することで各周波数成分の発生タイミングの同時性を検出し、これらを成分群を教師なし学習でグルーピングすることにより、周波数成分を発生音源ごとにベクトル量子化する手法を提案した。ソフトウェアシンセサイザを用いて生成した器楽音に対して、本ネットワークの動作を計算機シミュレーションした結果、提案手法を用いることで発生タイミングをずらして生成した3つの器楽音の混合信号を分離してベクトル量子化できることが確認され、本手法の有効性が示された。本研究の成果は、現在、電子情報通信学会D-11の論文として投稿中である。
|