研究課題/領域番号 |
16K00294
|
研究機関 | 東京工業大学 |
研究代表者 |
中臺 一博 東京工業大学, 工学院, 特任教授 (70436715)
|
研究分担者 |
鈴木 麗璽 名古屋大学, 情報学研究科, 准教授 (20362296)
小島 諒介 京都大学, 医学研究科, 特定助教 (70807651)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 鳥の歌の解析 / 音環境理解 / ロボット聴覚 / マイクロホンアレイ処理 / 音源識別 / 深層学習 |
研究実績の概要 |
平成28年度に構築した手法をさらに発展させる形で平成29年度の研究を進めた. 具体的には,低次情報の抽出に関しては,これまで構築してきた複数マイクロホンアレイによる二次元音源位置同定手法を改良して,オンライン処理ができるようにした.結果として,20秒程度のブロックに区切って処理を行えばオフライン処理と同等の性能が出ることを確認した.また,A/Dの揺れを補正する手法についてベイズモデルを用いた手法を提案した. 音響理解の枠組み構築については,前年度構築した深層学習手法CNNを用いた野鳥の声分類を組込み向けGPUボード上に実装し,リアルタイムで処理ができるように改良した.また,音源分離処理等で信号がダメージを受ける場合にこれを修復する手法を深層学習の一手法であるLSTMを改良することによって実装し,その有効性を示した.また,音環境理解のフレームワークとして,HARKBirdをインタラクティブに定位・識別・アノテーション処理ができるよう改良した.野鳥同士の関係性を推定については,HARKBirdを用いることによってウグイスを対象として,L型(縄張り主張型)およびH型(近隣個体威嚇型)の行動分析に利用できることを示した. 使いやすいシステムの構築については,マイクロホンアレイを改良し,高性能クロック・IMU・コンパスを搭載し,精度の対価データを簡単に収録できるようにした. データ収集と評価については,前年度収録したデータのアノテーション作業を進めることにフォーカスした.アノテーションしたデータを用いた結果,単純なCNNで80%を超える識別性能を得ることができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
提案時に計画していた低次情報の抽出,音響理解の枠組み構築,使いやすいシステムの構築,データ収集と評価といった項目について,上述のような成果が得られ、ほぼ提案通りに進んでいるため.
|
今後の研究の推進方策 |
今後の研究については,最終目標である音響理解の枠組み構築をより洗練されたものにすべく手法の統合やインタフェースの改善を目指す。また,構築したシステムを実データで評価し,有効性を示すことが課題である.また本提案では想定できなかった課題を抽出して次の研究につなげていくことも評価の一環としてしっかりと実施する予定である.
|