2017 Fiscal Year Research-status Report
標準化・正規化変換を利用した発話様式や時期変動に頑健な話者認識手法に関する研究
Project/Area Number |
25350488
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
長内 隆 科学警察研究所, 法科学第四部, 部長 (70392264)
|
Project Period (FY) |
2013-04-01 – 2019-03-31
|
Keywords | 話者認識 / 発話様式 / 時期変動 / 特徴量変換 / 犯罪捜査支援 |
Outline of Annual Research Achievements |
話者認識では、収録環境や発話様式などの違いが誤認識を引き起こす要因となる。本研究は、多様な音声資料に頑健な話者認識手法を確立することを目的としている。これまで、収録環境に焦点を当て、標準化・正規化変換(SNT)の適用によって収録環境の影響が軽減できることを単音と単語発話を対象として検証した。単語発話では、連続音声に由来する統計量を用いてSNTの有効性をついて検証した。対象音声の収録環境が未知であることを想定し、SNTを使う前処理に、ケプストラム平均値正規化法(CMN)を用いた。異なる収録環境で同時収録された成人男女の単語発話を対象とし、動的計画法を用いて、単語毎に男女別、異なるチャンネル間で照合実験を行った結果、CMN適用後にSNTを行うことで、全条件下で平均9ポイントの照合性能の改善が図られた。 昨年度は、発話様式の違いが照合性能に与える影響について調べた。成人男性18名が、通常の発話に加えて、話す速さ(速い・遅い)、声の高さ(高い・低い)、声の大きさ(大きい・小さい)を変えて発声した資料を対象とした。収録は、2時期にわたって各時期3回行った。発話回毎に母音、短文を発話し、音声発話区間の全フレームにおけるLPCケプストラム係数の平均値をその発話回の特徴量として照合を行った。なお、時期変動を除外するために同時期間の比較とした。発話様式間の違いが異なるほど距離が照合性能は低下し、特に声の大きさによる影響を強く受けることが示された。また、SNT適用の効果についても調べたところ、ほとんどのケースでSNT適用により照合率の向上が認められた。 さらに一昨年招へいしたオーストラリア国立大学Kinoshita博士とフォルマント周波数帯域毎に含まれる話者性情報についての予備的検討を国際学会でこれまでに発表したが、その後、それらの情報を用いた法科学的話者比較について継続して議論を重ねている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
一昨年までは、収録環境に焦点を当てて、その違いによる影響の軽減を目的として研究を行ってきた。昨年度は、発話様式の違いが照合性能に与える影響について調べ、その違いによる影響の軽減について検討した。いずれにおいても、我々が提案してきた標準化・正規化変換(SNT)を施すことで、それらの影響が軽減できることを確認した。 本課題の当初の目的は、多様な音声資料に頑健な話者認識手法を確立することであり、誤認識を引き起こす要因として、(1)録音条件、(2)発話様式、(3)時期変動を挙げ、それらについて検証することとしていた。(1)、(2)については目的を達成できているが、(3)については、時期変動は話者内変動の一部であるので、これまで検証した手法を適用することで、照合性能の向上を図ることが見込まれるが確認は取れていない。 上記に加えて、フォルマント帯域を指定する話者の異同識別手法についても継続して検討を行った。フォルマント周波数には個人性情報が含まれているが、雑音や話し方などの影響を受けやすく、客観的に抽出することは現状極めて困難である。そこで、陽にフォルマント周波数を抽出する代わりに、フォルマント帯域を指定し、話者の異同識別に利用する手法を検討している。これまで、フォルマント周波数帯域毎に含まれる話者性情報を利用することの有用性について国際学会で発表したが、その後、それらの情報を用いた法科学的話者比較について継続して議論を重ねている。
|
Strategy for Future Research Activity |
本課題は、平成29年度で終了予定であったが、延長が認められたので、以下の点に着目した研究を継続して推進する。 (1)時期変動の影響について:同一時期に収録した音声資料は話者内変動が小さいので話者認識の正答率は高くなる。一方、時期差があれば話者内変動が大きくなるので正答率は低くなる。そこで、時期差と照合性能の関係について調査し、時期差を考慮した照合手法を検討する。 (2)法科学分野への応用について:ケプストラム平均値正規化を前処理に用いた標準化・正規化変換を導入した、実務利用を念頭に置いた話者認識システムの開発を試みる。また、オーストラリア国立大学Kinoshita博士らと進めているフォルマント周波数帯域毎に含まれる話者性情報を利用した法科学的話者比較についても更なる検討を行う。
|
Causes of Carryover |
理由:昨年も人事異動で研究部から離れたため、研究に充てる時間を十分に確保することができなかった。 使用計画:研究期間の延長を申し入れ、認められたことから、平成30年度に補充すべき研究計画を立て、研究計画に沿った物品購入や成果報告のために執行する。
|
Research Products
(2 results)