2019 Fiscal Year Research-status Report
Project/Area Number |
19K04935
|
Research Institution | Osaka Electro-Communication University |
Principal Investigator |
早坂 昇 大阪電気通信大学, 情報通信工学部, 准教授 (50554573)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 悲鳴検出 / 深層学習 |
Outline of Annual Research Achievements |
本年度は,【課題1】である「劣悪な環境下における高い検出性能の達成」に取り組んだ. 劣悪な環境をシミュレーションするため,駅構内,交差点における雑音など実際の利用環境で考えられる雑音を6種類準備した.その雑音を,すでに収録済みの悲鳴データベースの音声に対し0,-5dBで重畳した悲鳴音声により様々な実験を実施した. 本年度は,劣悪な環境でも高い悲鳴検出性能を達成するため,深層学習を利用した雑音除去について検討した.具体的には,Wave-U-Netと呼ばれる,畳み込みニューラルネットワークの一種で,ボーカルと楽器音の分離などに利用される手法を用い,悲鳴音声と雑音を分離することで雑音除去を実現した. Wave-U-Netへの入力を雑音が重畳された悲鳴音声,出力を無雑音の悲鳴音声および雑音のみとして,ニューラルネットワークを学習した.その際,悲鳴データのうち半分の話者を学習用,残りを評価用とすることで,未知の話者への頑健性を確認した.また,準備した雑音も3種類を学習に用い,評価には同じ雑音(既知環境を想定)とそれとは異なる雑音(未知環境を想定)を用い,未知環境への頑健性についても調査を行った. まず,未知話者への頑健性については,悲鳴音声の性質上,危険を外部に伝える意志が働くため,話者による大きな変化はなく,未知話者への高い頑健性が確認できた.次に,未知環境に対する頑健性については,既知環境におけるSNRの改善は平均約15dBであるのに対し,未知環境では平均約13dBであり,僅かに低下したものの良好な結果であった. 次年度は,この雑音除去後の悲鳴音声を用い,リアルタイムで動作する悲鳴検出アプリケーションの開発と,悲鳴と類似した音による誤検出の削減について取り組みたい.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通りに進んでいる.2020年度は,2019年度に得られた結果を用い,実際の悲鳴検出システムの構築に着手したい.また,【課題2】である悲鳴音声と類似した音による誤検出の削減が未着手であるため,その課題の解決にも取り組む予定である.
|
Strategy for Future Research Activity |
2019年度は【課題1】に取り組みSNRの大幅な改善に成功した.2020年度はこの成果を小型PCやモバイル端末に実装し悲鳴検出システムを運用する計画である.ここで,消費電力やリソースの問題に直面する可能性があり,その対応についても検討する. また,もう【課題2】である「悲鳴とその類似音との識別精度向上」にも取り組む.この課題は,悲鳴と類似した音の収集が必要になるが,これまで提案されているシステムを次年度の早い段階で実装し,様々な場面で実運用しながら収集する予定である.また,すでに類似した音として把握している雑音(ブレーキ音など)については,それらを識別するニューラルネットワークを調査・実装し,識別制度の改善を図る.
|
Causes of Carryover |
深層学習用のPCを購入予定であったが,クラウドサービス等を利用することで対応し,不必要な出費を抑えたことが理由である. 一方で,最新の研究動向を調査するための学会参加や小型PCおよび学外での収録および開発作業の効率化を図るためのノートPCを購入したが,次年度使用額が0より大きいのはその差額である.
|