2015 Fiscal Year Research-status Report
超低SNR法科学的音声資料での発話内容の理解を可能とする手法の開発と信頼性の評価
Project/Area Number |
24710195
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
蒔苗 久則 科学警察研究所, 法科学第四部, 主任研究官 (20415441)
|
Project Period (FY) |
2012-04-01 – 2017-03-31
|
Keywords | 信頼性工学 / 裁判科学 |
Outline of Annual Research Achievements |
本年度は、これまでとは異なり、参照信号を使用しない雑音抑圧手法の開発と評価実験を行い、また、音声認識を応用した手法の開発を進めた。 街頭や店舗に設置された防犯カメラの普及にともない、犯罪の模様が記録される機会が増加している。しかし、店内放送などの著しい背景雑音により聴取が完全に不可能となる例が少なくない。そのため、本研究では、聴取が不可能な程SNRが低い音声資料を対象とした雑音抑圧手法の開発を行ってきた。 これまで開発してきた手法は、信号の表現にNMF(非負値行列因子分解)や正弦波モデルを使用し、必ずしもリアルタイム処理を必要とせず、雑音の音源を参照信号に利用可能な場合が多い法科学的な環境の特徴に基づいた処理であった。しかしながら、雑音音源の入手が困難である場合や、入手に時間を要する場合も少なくなく、これまで開発した手法の利用範囲は限定されていた。そこで、本年度は、参照信号を必要としない抑圧手法の開発を行った。 開発した手法では、観測信号をNMFや正弦波モデルで表現し、その振幅の閾値処理により、雑音と音声の分離を行っている。つまり、信号である音声のSNRが極めて低いため、信号と雑音の振幅が大きく異なる事に注目している。様々なSNRを示す音声資料を用いて評価実験を行った結果、NMFよりも正弦波モデルを用いた場合の方が抑圧性能に優れていた。原理的に明らかなように、SNRが比較的高い場合は抑圧性能が低く処理による効果は低いものの、SNRの低下に伴い抑圧性能は向上し処理による効果が確認された。一方、音声認識を用いた手法については、開発に必要な環境の整備にとどまった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究開始時には想定しておらず、これまでよりも適用範囲の広い抑圧手法を開発したものの、音声認識を用いた手法などについては、十分な結果が得られていないため。
|
Strategy for Future Research Activity |
音声認識を利用した手法の開発を進め、これまで開発した手法の適用範囲を検討するための評価実験を行う。
|
Causes of Carryover |
事前に想定していた研究計画と実際の実施状況に違いが生じ、研究成果の発表のための経費や、消耗品費として使用しなかった経費が生じたため。
|
Expenditure Plan for Carryover Budget |
学会発表や論文投稿などの成果発表のための経費や、研究を進めるために必要な消耗品などの購入のための経費としての使用を予定している。
|
Research Products
(2 results)