研究課題
基盤研究(C)
話者認識では、比較する音声資料の収録環境、発話様式、時期変動の違いが認証性能の劣化、つまり誤認識を引き起こす要因の一つと言われている。そこで、このような音声資料の環境の違いにも頑健な話者認識手法について調べた。本課題では、我々がこれまでに構築した多様な音声データベースを用いた。また、我々が先に提案し、話者認識性能の向上に効果があることを証明した標準化・正規化変換を利用した。その結果、標準化・正規化変換は、このような音声資料の環境の違いにも頑健な話者認識手法として有効であることを示した。
情報工学
非協力的な話者を扱うことが多い法科学分野においては、多様な音声資料に適応できる話者認識に期待する声は大きい。例えば、振り込め詐欺事件において、同一犯による犯行の解明には、犯人の音声を比較して同一話者か否かを判断する必要があるが、それぞれの事件の会話はさまざまである上、関係者を装うなど、話し方も多様となるケースが多い。本研究の成果を利用することで、多様な音声資料であってもそれぞれの事件の犯人の同一性を示すことが期待できる。