研究課題/領域番号 |
25350488
|
研究機関 | 科学警察研究所 |
研究代表者 |
長内 隆 科学警察研究所, 法科学第四部, 部付主任研究官 (70392264)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 話者認識 / 発話様式 / 時期変動 / 特徴量変換 / 犯罪捜査支援 |
研究実績の概要 |
話者認識では、登録時と認識時の音声資料の録音や発話様式などの条件の違いが誤認識を引き起こす要因となる。本研究は、このような音声資料のミスマッチの程度を図る指標の導出を試み、多様な音声資料に頑健な話者認識手法を確立することを目的としている。 今年度は、まず、標準化・正規化変換が、収録環境の影響を軽減する手法として知られているケプストラム平均値正規化と同様の効果が得られることを確認した。また、これまでは単音を対象とした話者照合実験において、単独発話された当該単音の母音部(例えば、「ア」なら「ア」、「ナ」なら「ナ」の母音部)から算出した統計量を用いて標準化・正規化変換を適用してきたが、同一母音(例えば、「ア」に対しては、ア、カ、サ、タ、ナ…の母音部)から統計量を算出して標準化・正規化変換を適用した結果、やや性能は低下するが効果が得られることを確認した。さらに、統計量の算出に連続音声を用いて同様の照合実験を行ったところ、母音から算出した統計量を用いるよりも性能はやや低いが照合性能の改善が図られた。これより、音韻によらない共通の統計量を用いることの可能性が示された。ケプストラム平均値正規化は、収録環境を陽に知ることができない場合でも収録環境の影響を軽減できるが、さらに特徴量のノルムを1に規格化し、同様の照合実験を行ったところ、照合性能の改善が図れることが示された。 オーストラリア国立大学Kinoshita博士を招へいし、法科学分野で効果的な音声言語解析法及び話者の異同識別に関する研究についての意見交換を行った。同博士は法科学分野における話者認識研究に従事しており、また、オーストラリア警察からの嘱託による音声鑑定も行っている。この招へいに合わせて、全国警察において音声鑑定に従事する研究者の出席を得て、日豪における音声鑑定に関するワークショップも開催した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年までの成果に加えて、今年度の研究では以下の2点について新たな知見を得た。 (1)ケプストラム平均値正規化の利用:標準化・正規化変換とケプストラム平均値正規化のそれぞれを用いた話者照合実験を行い、いずれの手法も収録環境の影響を軽減する効果があることを確認した。標準化・正規化変換は収録環境の諸元が既知である場合に利用できるが、収録環境の諸元が未知である場合は利用が困難と考えられていた。今回、当該発話の平均値を減算するケプストラム平均値正規化を利用し、そのうえで、ノルムを1に規格化する変換を施すことで照合性能の改善が図られることが示された。 (2)連続音声からの統計量算出:これまでは標準化・正規化変換を適用する話者照合に用いる音声として母音を対象として検討してきたが、統計量の算出に連続音声を用いたところ効果が得られた。これにより、音韻によらない共通の統計量を用いること、話者照合に用いる音声資料を連続音声へと拡張させることの可能性が示された。 上記の知見に加えて、音声鑑定の実務面における調査として、応募当初は計画していなかったが人事異動により研究以外の業務が多忙となったため、研究を深化させる代わりに、音声鑑定に携わる研究者らとともにワークショップを開催することで、実務面での問題点を掘り起こすことに焦点を当てて活動した。
|
今後の研究の推進方策 |
次年度は、以下の点に着目した研究を推進する。 (1)標準化・正規化変換とケプストラム平均値正規化の融合:ケプストラム平均値正規化の利用により、収録環境の諸元が未知であっても対応できる可能性が示された。そこで、ケプストラム平均値正規化を標準化・正規化変換における標準化処理の前処理として実施することの有効性について検討する。 (2)連続音声を対象とした話者照合実験:標準化・正規化変換に用いる統計量を連続音声から算出しても効果が得られることが示された。そこで、標準化・正規化変換を連続音声に施した上で話者照合実験を行い、その有効性について検討する。
|
次年度使用額が生じた理由 |
3月中旬の人事の内示を待って提出できるよう消耗品等の購入を計画していたが、業務引き継ぎなどで多忙となり、結果として翌年度の執行となってしまったため、予算を繰り越すこととなった。
|
次年度使用額の使用計画 |
計画通り、年度当初に消耗品等の購入に充てた。
|