2017 Fiscal Year Annual Research Report
Speaker classification using residence information based probabilistic model
Project/Area Number |
26350466
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
鎌田 敏明 科学警察研究所, 法科学第四部, 室長 (10356173)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 音声情報処理 / 話者分類 / 法科学 |
Outline of Annual Research Achievements |
音声による話者認識では、声道の共鳴特性に由来するスペクトル包絡から得られるケプストラムに基づく工学的手法の研究が多く行われてきた。一方、日本語の方言や地域性による話者の地域分類は音声学、言語学の分野で扱われ、工学的手法に基づく研究分野ではほとんど行われていなかった。そこで本研究では、発話者の地域属性を、確率モデルを用いて客観的手法による地域分類のシステム構築を行うことにより、法科学分野の側面からの安全な社会基盤の構築を目的とする。 音声コーパスからの特徴量の抽出として、電話を通して録音された各地域90~120名の男性話者音声コーパスを利用した実験を行い、地域性情報の抽出に関する実験を行った。利用するケプストラムはLPCケプストラム係数、メル周波数ケプストラム係数などやそのデルタケプストラムである。得られたケプストラム空間から、2話者における話者間距離を算出し、実験で用いる特徴量とした。これらの特徴量から地域モデルを作成し、検証用データを使って、クラスタリングの性能を、確率モデルによって統計的に評価した。 関東、関西、九州の3地域について地域モデルを作成し、モデル作成に使用していない各地域の30~40名の話者データによってクラスタリングの性能評価実験を行ったところ、関東は約7割、関西は約6割のデータが正しくクラスタリングされたが、九州は5割以上のデータが誤判定であり、関東への誤判定が多いことが分かった。別の地域の組み合わせによる評価実験では誤判定がさらに多い地域もあったことから、性能向上のためには、地域モデルの構築には、地域属性に適応する必要があると考えられた。
|
Research Products
(1 results)