2010 Fiscal Year Annual Research Report
ベイズ統計に基づく話者の異同識別鑑定における尤度比尺度の改良
Project/Area Number |
21510185
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
長内 隆 科学警察研究所, 法科学第四部, 室長 (70392264)
|
Keywords | 統計数学 / 音声学 / ベイズ統計 / 話者認識 / 犯罪捜査支援 |
Research Abstract |
法科学分野における話者の異同識別鑑定にベイズ統計の概念に基づいた尤度比尺度を利用することを検討している。既存の尤度比尺度の利用にあっては、抽出した音韻区間の1フレームを利用するが、抽出した音韻区間全体を利用する尤度比尺度の改良を目指している。今年度は、連続区間を1音だけ利用するときに適した尤度比尺度を提案し、その有効性を確認した。 音韻に含まれる個人性については、昨年から引き続き、鼻音を対象とした検討を行い、鼻音に後続する母音の鼻音化の程度が話者に依存する可能性を示した。また、他の音韻として、カ、サ、タ、ハ、ラ、ガ、ザ、ダ、バ、パ行とシャ、シュ、ショ、チャ、チュ、チョを対象とし、これらの音韻から子音と母音を周波数分析並びに聴取によって分割した。なお、これらの作業を行うために、研究補助者の雇い上げを行った。 テキスト独立型話者認識では、比較する音声資料の発話内容に条件を必要としない。しかし比較する発話に同じ内容の発話が含まれる割合が高いほど認識性能は高いことがわかった。そのため、話者認識結果の信頼性を、比較に用いた音声資料そのものから評価する必要性が生じた。まず発話長と認識性能との関係を調べた結果、一般に発話長が長いほど認識性能は高くなるが、音韻的に偏りがある音声資料に対しては認識性能が評価できないことが示された。つまり、比較する発話の内容が音韻的にどの程度類似しているかを定量化する必要が生じた。 そこで、複数の背景話者音声からベクトル量子化によって求めたコードブックを求め、入力音声の各フレームがどのコードブックに最も近いかを調べ、その出現頻度を利用する方法を試みた。その結果、求めた出現頻度を利用することで音韻的類似性が評価できる可能性を示した。 昨年に引き続き、オーストラリアの法科学話者認識研究者や各都道府県警察の科学捜査研究所で音声鑑定を担当している研究者との意見交換を行った。
|
Research Products
(5 results)