2022 Fiscal Year Annual Research Report
声帯音源情報を取り入れた位相補正に基づく話者推定法の開発-法科学応用へ向けて-
Project/Area Number |
20K23357
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
岡田 昌大 科学警察研究所, 法科学第四部, 研究員 (80874502)
|
Project Period (FY) |
2020-09-11 – 2023-03-31
|
Keywords | 位相補正 / Electroglottography / 声道フィルタの位相特性 / 話者性・個人性 / 発話スタイル / 角度統計 / 平均位相スペクトル |
Outline of Annual Research Achievements |
本研究は、音声と声帯音源の組み合わせによる位相補正に着目した話者推定法を開発するため、次に示す手順で実施された。 (1) 声道フィルタの位相特性の可視化:最初に、位相補正による位相可視化のための信号処理について検討した。本研究で可視化される位相は話者の声道の解剖学的特徴を直接反映するため、位相を目視で観察するだけでも話者による差異を検出できる可能性がある。可視化を実現するため、先行研究で報告されている位相補正法を音声と声帯音源波形のデータ対に適用できるよう理論体系を整理し、実際のデータを使って可視化を試みた。可視化の結果、位相は同一話者の同一発話文においては一貫性があり、同一発話文でも異なる話者では異なる特徴を示すことがわかった。したがって、可視化された位相は話者を識別できる能力を有していることが明らかとなった。 (2) 平均位相スペクトルの考案:目視による位相の評価に加えて定量的な評価も行えるよう、位相の数値的処理法の開発を行った。位相は2πの周期性を持ち、通常我々が利用している実数の処理法では扱いが難しいため、角度統計の代表的な量である角度平均の計算方法を適用し、平均位相スペクトルを考案した。 (3) データ計測及び平均位相スペクトルによる話者識別実験:上記(2)で考案した平均位相スペクトルを使用して話者識別実験を行った。そのために、音声と声帯音源波形の対データの収録実験を実施した。得られたデータから平均位相スペクトルを計算した後、その類似性を相関係数で得点化し、得点をもとに話者識別を行った。実験の結果、話者識別の正答率は高い値を示しながらも閾値の設定に影響を受けにくいことが明らかとなり、平均位相スペクトルはより正確に話者を識別することがわかった。
|
Research Products
(2 results)