研究課題/領域番号 |
19K20304
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 同志社大学 (2020-2021) 立命館大学 (2019) |
研究代表者 |
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 環境音分析 / 音響イベント検出 / 音響シーン分類 / マルチタスク学習 / スパース性 / 不均衡データ / グラフラプラシアン正則化 / ケプストラム / 音響シーン分析 |
研究開始時の研究の概要 |
本研究課題は,音響イベントには共起性・スパース性がある点や,収録環境(シーン)と発生する音響イベントの種類が関連している点に着目し,これらをモデル学習時の拘束条件に課すことで,少量の環境音データを用いた場合でも高性能な分析を可能とする音響イベント分析法の実現を目指す. 研究期間内に,音響イベントの共起性やスパース性を学習則に組み入れた深層学習法の提案や,音響シーンとイベントのマルチタスク学習法,また,それらを組み合わせた手法の提案を目指す.
|
研究成果の概要 |
本研究課題は,音響処理技術において重要なトピックの1つである環境音分析において,少量の環境音データのみを用いた場合でも高い分析性能を達成する手法の実現を目指した.とりわけ本課題では,環境音の共起性や,収録環境による音響イベントの発生の遍在性を利用した音響イベント検出について検討を進めた.研究期間内に,音響イベントの共起性を従来の深層学習に導入する手法や,音響イベント検出とシーン分類のマルチタスク深層学習手法を提案した他,音響イベント間のデータに不均衡が生じている場合でも性能低下を引き起こさないモデル学習手法を提案し,高精度に音響イベント検出が可能となることを示した.
|
研究成果の学術的意義や社会的意義 |
人間の耳のように,様々な環境音の種類を聞き分ける技術が実現できれば,補聴器などの聴覚補助システムのみならず,公共スペースでの自動監視システム,高齢者や乳幼児の見守りシステム,自動運転の補助,環境の自動モニタリング,知的ロボットなど様々なサービスに広く貢献できる.このように,環境音分析は音響処理の中でも非常に重要な技術として位置づけられる.また,画像/動画の分析などの技術と組み合わせることで,人間の知覚を模した人工知能を実現することも可能となる.
|