2019 Fiscal Year Research-status Report
あらゆる環境音を分析可能とする音響イベント検出手法の検討
Project/Area Number |
19K20304
|
Research Institution | Ritsumeikan University |
Principal Investigator |
井本 桂右 立命館大学, 情報理工学部, 助教 (90802116)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 環境音分析 / 音響イベント検出 / 音響シーン分類 / スパース性 / マルチタスク学習 / グラフラプラシアン正則化 / ケプストラム |
Outline of Annual Research Achievements |
本研究課題では,環境音分析の重要な課題である音響イベント検出において,少量ずつの環境音データを用いた場合でも高い分析性能が実現可能な音響イベント検出法の実現を目指すことを目的としている. 平成31年度の計画としていた,1)音響イベントの共起性とスパース性を考慮した手法について検討を進め,音響イベントの共起性をグラフラプラシアン正則化として定式化し,従来の深層学習に導入する新たな手法を提案し,従来法よりも飛躍的に高い性能を発揮することを確認した.また,本検討を進めるにあたり,屋内環境における環境音データベースを収録し,国際会議論文として発表した.本データベースは次年度の公開を予定している.さらに,本検討を進める中で注目した音響信号のグラフ表現を応用し,ケプストラム特徴量をグラフ信号領域に拡張したグラフケプストラムという手法を考案し,英語論文を発表した.グラフケプストラムを用いることで,部分的に時間同期された複数のマイクロホンアレイを活用して,音源の空間情報を取得し,環境音分析に活かすことが可能となる. また,当初の計画では令和2年度の計画としていた,2)収録環境(シーン)と発生する音響イベントの種類が関連している性質に着目した音響イベント検出手法についても一部検討を開始し,音響イベント検出と音響シーン分類のマルチタスク深層学習を行う手法を提案し,従来法よりも高い性能で音響イベントを検出できることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
ジャーナル論文2編,国際会議論文5編(うち3編は、ICASSP, WASPAAという分野のトップ会議論文を含む),また,国内学会発表7件という成果が得られた.これらに関連する成果として,第3回 IEEE Signal Processing Society (SPS) Tokyo Joint Chapter Student Awardおよび日本音響学会 学生優秀発表賞を受賞した.加えて,1件の学会招待講演,1件の特別授業,その他複数の講演会などを行い,多くの参加者と反響を得た.一部は令和2年度の計画を始めるなど,これら成果は当初の予定を大幅に超えるものであり,当初の計画以上に研究は進展していると言える.
|
Strategy for Future Research Activity |
現在順調に研究が進展しており,当初の計画から大きな変更は必要ないと考えている.今後は2)収録環境(シーン)と発生する音響イベントの種類が関連している性質に着目した音響イベント検出手法について,さらに少量のデータで高い音響イベント検出性能が発揮できる情報統合方法について検討を進める.また,手法1)と2)の統合方法についても検討を進め,さらなる音響イベント検出性能の向上を目指す.また,補聴器やセキュリティモリタリング機器などへの音響イベント検出の適用といった,実用的な応用についても検討を進める.
|
Causes of Carryover |
購入予定であった計算機および計算機周辺機器の購入計画を見直したため.ただし,計算機はすでに所持しているものを利用したため,研究計画の変更はない.また,計算機および計算機周辺機器は本年度購入を予定している.
|
Research Products
(13 results)