2008 Fiscal Year Annual Research Report
声道共鳴特性を用いた話者の地域性情報とクラスタリングに関する研究
Project/Area Number |
20700177
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
鎌田 敏明 National Research Institute of Police Science, 法科学第四部, 主任研究官 (10356173)
|
Keywords | 音声情報処理 / 話者認識 / 法科学 |
Research Abstract |
音声による話者認識では、音声中に含まれる個人性情報は声道の共鳴特性に由来するスペクトル包絡から得られるケプストラムに基づく研究が行われてきた。そこで本研究では、話者認識において、ケプストラムの特徴量から話者の居住地として地域性情報を抽出すること及び得られた地域性情報による話者のクラスタリングを目的とする。 音声コーパスからの特徴量の抽出として、電話を通して録音された約3000名の男性話者音声コーパスを利用した実験を行い、地域性情報の抽出に関する実験を行った。利用するケプストラムはLPCケプストラム係数、メル周波数ケプストラム係数などやそのデルタケプストラムである。得られたケプストラム空間から、2話者における話者間距離(大きさ)及び回転性の情報を算出し、これらを実験で用いる特徴量とした。 そこで得られた特徴量の大きさ及び回転性の情報と音声コーパスにラベリングされている身長の身体的特徴との関係について、実データを用いての実験及び検証を行った。予備実験としてマイクロホンを通した音声コーパスを利用して、ケプストラムと声道長を含む個人性情報との関係について実験を行ったのち、電話を通した音声コーパスによる実験を行い、電話を通した音声による伝送系歪みの影響について比較検討を行ったうえで、話者の地域性情報との関係について調べた結果、地域性情報が伝送系の影響を大きく受けていることが分かった。また回転性と声道長の関係についても伝送系や話者内変動の影響を大きく受けることが分かったが、正規化を行うことにより話者の個人性を抽出できる可能性が示唆された。
|