2013 Fiscal Year Research-status Report
超低SNR法科学的音声資料での発話内容の理解を可能とする手法の開発と信頼性の評価
Project/Area Number |
24710195
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
蒔苗 久則 科学警察研究所, 法科学第四部, 主任研究官 (20415441)
|
Keywords | 信頼性工学 / 裁判科学 |
Research Abstract |
最初に、抑圧手法の開発や今後の研究の基礎データとするため、音楽などの背景雑音存在下での音声収録とデータベース化を行った。収録の際は、再現性を確保するためにあらかじめ収録した音声と背景雑音を別個のスピーカから再生させた。収録に用いた音声には、多様な声質や発話内容を対象とするため、当所で作成した音声データベースを用いた。これには600人以上から収録した母音などの単音節、単語、短文が収録されている。また、作業の効率化を図るため、収録や切り出し作業を自動化した収録系を構築し、収録作業とデータベース化を行った。 次に、実務上、頻繁にみられるインパルス性雑音を抑圧するため、信号表現にNMF(非負行列因子分解)を利用した雑音抑圧手法を提案した。インパルス性雑音は、聴取者の注意が向かうため著しく聴取性を損ない、また、広帯域性の雑音であるため周波数フィルタによる抑圧処理は困難である。 観測信号のスペクトログラムから音声成分と雑音成分の視認は比較的容易であることから、これに注目した雑音抑圧手法を提案した。提案手法では、スペクトログラム上の音声成分や雑音成分をいわば画像とみなし、両成分を別個の画像として分離するためにNMFを利用した。NMFは目的関数の最適化問題として解かれるため、目的関数を適切に構成する必要がある。提案手法では、画像の相互相関に相当する制約条件を目的関数に導入した。また、得られた目的関数の解析的な最適化は困難であるため、同様の最適化問題の解法として広く用いられている乗法更新アルゴリズムと類似したアルゴリズムを導出した。評価実験を行ったところ、高品質な音声は得られなかったものの、発話内容の理解は可能な程度の音声が得られた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在まで、NMFを利用した雑音抑圧手法の開発や、検証用音声データ収録系の構築と収録作業を進めており、おおむね計画通りである。
|
Strategy for Future Research Activity |
音声認識システムを利用した手法を試みる。一般的な音声認識システムによる雑音存在下での認識は、音響モデルのミスマッチなどにより困難とされている。一方、法科学的な応用を考えると、ミスマッチを解消するため、対象とする雑音存在下での音声を用いた音響モデルの再構築が可能である。また、雑音に応じたシステムの最適化なども可能である。つまり、法科学的な場面ではリアルタイム性などの制約が存在しないため、これを利用した雑音存在下での音声認識を試みる。
|
Expenditure Plans for the Next FY Research Funding |
事務手続きの遅れによる。 事務手続きの問題であるため速やかに執行する。
|
Research Products
(5 results)