2009 Fiscal Year Annual Research Report
声道共鳴特性を用いた話者の地域性情報とクラスタリングに関する研究
Project/Area Number |
20700177
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
鎌田 敏明 National Research Institute of Police Science, 法科学第四部, 主任研究官 (10356173)
|
Keywords | 音声情報処理 / 話者認識 / 法科学 |
Research Abstract |
音声による話者認識では、音声中に含まれる個人性情報は声道の共鳴特性に由来するスペクトル包絡から得られるケプストラムに基づく研究が行われてきた。また、このような信号処理手法による話者認識において、日本語を母語とする日本人の話者認識を行う研究では、日本人モデルを構築した上での理論及び実験的検討が行われてきた。そこで本研究では、話者認識において、ケプストラムの特徴量から話者の居住地として地域性情報を抽出すること、及び得られた地域性情報による話者のクラスタリングを目的とする。 音声コーパスからの特徴量の抽出として、電話を通して録音された約3000名の男性話者音声コーパスを利用した実験を行い、地域性情報の抽出に関する実験を行った。利用するケプストラムはLPCケプストラム係数、メル周波数ケプストラム係数などやそのデルタケプストラムである。得られたケプストラム空間から、2話者における話者間距離を算出し、これらを実験で用いる特徴量とした。 音声コーパスから東京及び大阪を含む5地域の居住者データを抽出し、同一話者の話者内距離、同一地域内における別人の話者間距離及び異なる地域間における別人の話者間距離を求め、地域間において話者間距離に違いが現れるかどうかについての実験を行った。得られた別人の話者間距離分布から、同一地域の話者間距離は異なる地域の話者間距離よりも小さく、地域性情報を抽出できる可能性が示された。また大阪地域は同一地域と異なる地域間での話者間距離が比較的大きく、東京地域は同一地域と異なる地域間での話者間距離が小さくなることから、地域性情報のクラスタリングの可能性についても示された。
|