2011 Fiscal Year Annual Research Report
ベイズ統計に基づく話者の異同識別鑑定における尤度比尺度の改良
Project/Area Number |
21510185
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
長内 隆 科学警察研究所, 法科学第四部, 室長 (70392264)
|
Keywords | 統計数学 / 音声学 / ベイズ統計 / 話者認識 / 犯罪捜査支援 |
Research Abstract |
法科学分野における話者の異同識別にベイズ統計の概念に基づいた尤度比尺度を利用することを検討している。既存の尤度比尺度では、対象とした音韻区間の1フレームを複数抽出する。一方、法科学分野で扱う音声資料は十分な発話長が確保できないことが少なくないため、得られた音声資料をできるだけ有効に利用することが望ましい。 これまで、抽出した音韻区間全体を利用する尤度比尺度を提案し、1つの連続区間を対象とした検証実験の結果、その有効性を確認した。今年度は、複数の連続区間を対象とした検証実験を行った。その結果、1つの連続区間のときと同様に、本提案法の有効性が確認された。ここでは、着目した1つの母音に対して、その母音の連続区間を複数対象としたものである。母音には話者性情報が多く含まれるが、子音にも話者性情報は含まれるとの報告がある。そこで単音節を対象とし、子音、母音の各々の話者認識性能を調べた結果、子音の話者認識性能は、子音によってばらつきが大きいが、鼻音のそれは高く、母音と同程度であるといった従来の知見を再確認した。音声資料の有効利用といった観点から、今後は、複数種類の母音や子音を組み合わせた比較手法について検討する必要があると考える。 尤度比尺度の新たな利用として、日本語母語話者、非母語話者の識別に適用できるか否かについての検討を開始した。まずはオーソドックスな比較判断方法について検討を行ったのみであるが、今後、尤度比尺度の利用について検証を行う。 法科学分野で扱う音声資料は、様々な収録環境下で収録される。そのため、話者認識性能を評価するために、収録環境に応じた評価用テストデータセットの構築が望まれる。実環境下における収録を検討したものの、様々な環境下で実際に収録を行うことは極めて困難であることから、既存の音声データベースを利用して、疑似的に収録環境を再現する手法について検討した。音声データベースの再構成については次年度試みることとした。 また、これまでに引き続き、オーストラリアの法科学話者認識研究者や各都道府県警察の科学捜査研究所で音声鑑定を担当している研究者との意見交換を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ベイズ統計に基づく尤度比尺度を用いた話者の異同識別にあっては、従来、音声資料の一部分しか利用していない。そこで、音声資料の有効利用を図ることを目的とした尤度比尺度を提案した。また、これまでにその対象を、1つの連続区間、複数の連続区間へと拡張し有効性を検証した。評価用データセットの構築にあっては、録音機の調査を行った。したがって、本研究は「おおむね順調に進展している」と判断する。
|
Strategy for Future Research Activity |
これまで同様、以下の2つの観点から研究を遂行する。 ・「尤度比尺度の改良」にあっては、1つの連続区間、複数の連続区間を対象とした検証を行い、本提案法の有効性を確認した。ただし、同一音韻を対象としたので、今年度は、複数の音韻を組み合わせるタスクを設定し、本提案法の有効性の確認並びに改良を検討する。 ・「評価用テストセットの構築」にあっては、マイクロホンで収録した音声を再生し、いくつかの録音機を介して収録することで、多様な収録系のデータベースに変換する。この疑似的に再構成したデータベースを利用して評価用テストセットを構築する。
|