研究課題/領域番号 |
25350488
|
研究機関 | 科学警察研究所 |
研究代表者 |
長内 隆 科学警察研究所, 法科学第四部, 部付主任研究官 (70392264)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 話者認識 / 発話様式 / 時期変動 / 特徴量変換 / 犯罪捜査支援 |
研究実績の概要 |
話者認識では、登録時と認識時の音声資料の録音や発話様式などの条件の違いが誤認識を引き起こす要因となる。本研究は、このような多様な音声資料に頑健な話者認識手法を確立することを目的としている。これまで、単音を対象とし、同一母音に由来する統計量を用いるという条件の下、標準化・正規化変換(SNT)によって収録環境の影響が軽減できることを確認した。今年度は、単語発話を対象とし、連続音声に由来する統計量を用いたSNTの有効性について検証した。用いた音声資料は、4つの異なる収録環境で同時収録された成人男女各200名の単語発話音声(単語数66語)である。動的計画法を用いてテキスト依存型話者照合実験を行い、照合性能を調べた。対象音声の収録環境が未知であることを想定すると、事前にSNTを使うことができないので、収録環境の影響軽減にはケプストラム平均値正規化法(CMN)を用いた。まず、CMN適用後の音声資料から求めた統計量の差異について検討した結果、収録環境の違いによる統計量の分散が、CMN適用前よりも3~4桁小さくなることが認められた。次に、CMN適用後の音声資料から算出した統計量を用いてSNTを施して、単語毎に男女別、異なるチャンネル間の比較、計792条件で照合実験を行った。その結果、CMN適用によって、全条件の約92%で照合性能が改善した。さらに、CMN適用後にSNTを行うことで、全条件下で照合性能が改善し、平均9ポイントの改善が図られた。 さらに昨年招へいしたオーストラリア国立大学Kinoshita博士と継続的に法科学分野における話者の異同識別についての意見交換を行ってきた。母音のフォルマント周波数は話者性情報を強く含むが客観的に抽出することが困難であることから、フォルマント周波数帯域を選択して比較する方法について議論を重ね、その予備的検討を国際学会で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年までの成果に加えて、今年度の研究では以下の2点について新たな知見を得ることができた。それに加えて、フォルマント帯域を指定する話者の異同識別手法についても検討を行うことができた。フォルマント周波数には個人性情報が含まれているが、雑音や話し方などの影響を受けやすく、客観的に抽出することは現状極めて困難である。そこで、陽にフォルマント周波数を抽出する代わりに、フォルマント帯域を指定し、話者の異同識別に利用する手法の検討を行い、予備的検討ではあるが、その有用性が示唆された。 (1)CMNを話者照合の前処理とする効果:収録環境が未知な場合、特徴量の統計量に関する情報がないため、SNTを適用することはできない。一方、CMNは、当該音声資料がある程度の発話長を有していれば、適用可能である。そこで、事前にCMNを適用した後の統計量が、収録環境の影響をどの程度受けているかを調べた。その結果、CMN適用後の統計量の分散は、適用前よりも極めて小さくなることが認められた。これより、収録環境が未知であっても収録環境の影響が軽減できることから、CMNを前処理とすることの有効性が示唆された。 (2)単語発話を対象としたテキスト依存型話者照合におけるSNTの有効性:これまで、定常的な特徴量として扱える単音を対象としていたが、実務を考慮すると、単語発話への拡張が不可欠である。昨年、連続音声から算出した統計量を用いてSNTを行ったところ、ある程度の効果が得られることを確認したので、今年度は、動的計画法によるテキスト依存型話者照合に適用した。単語毎に男女別、異なるチャンネル間の比較した計792条件の照合実験を行った結果、全条件下で照合性能が改善し、平均9ポイントの改善が図られた。
|
今後の研究の推進方策 |
次年度は、以下の点に着目した研究を推進する。 (1)前処理に用いるケプストラム平均値正規化における発話長の影響に関する検討:ケプストラム平均値正規化は、対照資料中の発話区間の特徴量の平均値を除する処理であるが、その平均値を求めるにあたって、どのくらいの発話長が必要となるかについて調査する。また発話の長さだけでなく発話の内容、つまり音韻の種類による影響も受けると考えられるので、併せて検討する。 (2)ケプストラム平均値正規化を前処理に用いた標準化・正規化変換を導入した話者認識システムの開発:昨年度の成果を踏まえた上で、話者認識システムへの導入を試みる。実務利用を念頭に置いたシステム開発を行う必要があることから、発話時期差や発話様式の違いを想定した話者照合実験を行い、そのときの性能を検証する。
|
次年度使用額が生じた理由 |
本課題の研究期間中、幾度となく所属内部の人事異動があり、そのため、予算執行が年度マタギとなるケースが多かった。今年度は、それを取り戻すべく、学会参加、情報収集のための旅費や実験環境の整備、拡張などを年度当初計画に沿って執行してきたが、まだ若干足りなかったものと思われる。
|
次年度使用額の使用計画 |
現状を踏まえ、研究の進捗に即した予算執行計画を早急に立てることとする。
|