研究課題/領域番号 |
19K20304
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 同志社大学 (2020-2021) 立命館大学 (2019) |
研究代表者 |
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 環境音分析 / 音響イベント検出 / 音響シーン分類 |
研究成果の概要 |
本研究課題は,音響処理技術において重要なトピックの1つである環境音分析において,少量の環境音データのみを用いた場合でも高い分析性能を達成する手法の実現を目指した.とりわけ本課題では,環境音の共起性や,収録環境による音響イベントの発生の遍在性を利用した音響イベント検出について検討を進めた.研究期間内に,音響イベントの共起性を従来の深層学習に導入する手法や,音響イベント検出とシーン分類のマルチタスク深層学習手法を提案した他,音響イベント間のデータに不均衡が生じている場合でも性能低下を引き起こさないモデル学習手法を提案し,高精度に音響イベント検出が可能となることを示した.
|
自由記述の分野 |
音響信号処理
|
研究成果の学術的意義や社会的意義 |
人間の耳のように,様々な環境音の種類を聞き分ける技術が実現できれば,補聴器などの聴覚補助システムのみならず,公共スペースでの自動監視システム,高齢者や乳幼児の見守りシステム,自動運転の補助,環境の自動モニタリング,知的ロボットなど様々なサービスに広く貢献できる.このように,環境音分析は音響処理の中でも非常に重要な技術として位置づけられる.また,画像/動画の分析などの技術と組み合わせることで,人間の知覚を模した人工知能を実現することも可能となる.
|