• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

標準化・正規化変換を利用した発話様式や時期変動に頑健な話者認識手法に関する研究

Research Project

Project/Area Number 25350488
Research InstitutionNational Research Institute of Police Science

Principal Investigator

長内 隆  科学警察研究所, 法科学第四部, 部付主任研究官 (70392264)

Project Period (FY) 2013-04-01 – 2018-03-31
Keywords話者認識 / 発話様式 / 時期変動 / 特徴量変換 / 犯罪捜査支援
Outline of Annual Research Achievements

話者認識では、登録時と認識時の音声資料の録音や発話様式などの条件の違いが誤認識を引き起こす要因となる。このような音声資料のミスマッチの程度を図る指標の導出を試み、多様な音声資料に頑健な話者認識手法を確立することを目的とし、今年度は以下を実施した。
(1)多様な音声資料に対する音響特徴量の頑健性の調査:録音条件、発話様式、時期変動など、多様な音声資料に対する各種音響特徴量の性質について調査した。特に、発話様式の違いとして、話す速さ(速い、普通、遅い)、声の大きさ(大きい、普通、小さい)、高さ(高い、普通、低い)の各条件で発声した音声データベースを用いて基本周波数について調べた結果、声の高さの制御で変化することはもちろんであるが、声の大きさの制御でも変化し、声が大きいほど高くなる傾向があることがわかった。
(2)標準化・正規化変換が音響特徴量に与える影響についての調査:固定電話と携帯電話を介した音声を同時収録した音声データベースを用いて、標準化・正規化変換による話者認識性能について検討した結果、異なる収録系間の話者照合において性能の向上が図られることを確認した。また判断基準であるしきい値についても、収録系の影響が小さくなることを確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

(1)多様な音声資料に対する音響特徴量の頑健性の調査:発話様式の違いとして、基本周波数については、声の大きさの制御でも変化し、声が大きいほど高くなる傾向があることがわかった。フォルマント周波数についても調べたが、顕著な相関は見ることができなかった。他の音響特徴量についても継続調査する。
(2)標準化・正規化変換が音響特徴量に与える影響についての調査:標準化・正規化変換によって話者認識性能の向上ならびに判断基準であるしきい値の変動が抑制されることを確認した。しかし、変換には音響特徴量の母集団の統計量である平均値、標準偏差が必要であるが、それらが未知である場合について検討する必要がある。
上記の当初計画以外に、以下を実施した。
(3)話者認識性能のデータベース間の比較:これまでに当研究所で構築した4つの大規模な音声データベースに含まれる単独に発声された単語発話音声のうち、共通する単語音声20語を用いたテキスト依存型話者照合実験を行い、話者内距離分布、話者間距離分布の各種統計量が音声データベースの違いにどのような影響を受けるかについて検討した。話者照合実験に用いる話者数を300名とし、各音声データベースを用いたときの話者内距離分布、話者間距離分布の各種統計量(各距離分布の平均値,標準偏差ならびにしきい値,照合率)と各統計量間の相関を調べた。その結果、各統計量は音声データベースの諸元の影響を受けて大きく変動すること、各距離分布の平均値としきい値間には相関があり、特に話者間距離分布の平均値としきい値間の相関が強いことがわかった。

Strategy for Future Research Activity

次年度は、以下の点に着目した研究を推進する。
(1)音響特徴量の母集団の統計量の推定:標準化・正規化変換には音響特徴量の母集団の統計量である平均値、標準偏差が必要である。しかし必ずしもそれらが既知ではないことから、推定手法について検討する。
(2)発話様式の異なる発話間の相対的な位置関係の把握:同一話者による発話様式の異なる音声の特徴量の相対的な位置関係を調べる。また、話者によってそれらの相対的位置関係が保たれるか否かについて解析する.
(3)法科学分野における話者認識研究者の招へい:オーストラリア国立大学Kinoshita博士を招へいし、法科学分野で効果的な音声言語解析法及び話者の異同識別に関する研究についての意見交換を行う計画を策定中である。同博士は法科学分野における話者認識研究に従事しており、また、オーストラリア警察からの嘱託による音声鑑定も行っている。平成21年に科学研究費補助金基盤研究(C)「ベイズ統計に基づく話者の異同識別鑑定における尤度比尺度の改良」の研究にあたり、同博士を招へいし、話者認識研究を法科学分野における音声鑑定に適用する際の留意事項や日豪の音声鑑定技術に関する意見交換を行った。今回も同様の意見交換を行うとともに、同博士の現在行っている研究の詳細を教示してもらい研究の推進を図る。

Causes of Carryover

2月中旬に消耗品の購入を申請したが、調達に時間がかかり翌年度の執行となってしまったことから、予算の繰り越しとなった。

Expenditure Plan for Carryover Budget

繰り越し分については、予定していた消耗品の購入にあてた。
今年度は、消耗品の購入、学会参加のための旅費など当初の計画のほかに、オーストラリアから研究者を招へいすることを計画している。この研究者とは、かねてより研究協力体制を確立しており、先の科研費による研究でも招へいした。当初は調整がつかなかったが、新たに調整したところ対応可能となったことから計画するものである。

  • Research Products

    (1 results)

All 2014

All Presentation (1 results)

  • [Presentation] 音声データベースの違いによる話者照合性能の比較2014

    • Author(s)
      長内 隆, 網野加苗, 鎌田敏明, 蒔苗久則
    • Organizer
      日本法科学技術学会 第20回学術集会
    • Place of Presentation
      ホテルフロラシオン青山
    • Year and Date
      2014-11-13 – 2014-11-14

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi