研究課題/領域番号 |
19K11975
|
研究機関 | 大同大学 |
研究代表者 |
柘植 覚 大同大学, 情報学部, 教授 (00325250)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | 話者認識 / バイオメトリクス認証 / 個人認証 / 人工音声 |
研究実績の概要 |
未来に到達するIoT(Internet of Things)時代におけるセキュリティ強化として生体情報を用いた個人認証が注目されている。特に、音声による個人認証(話者認識)は利便性が高く有効な個人認証方法の一つであると言える。しかし、音声合成技術の飛躍的な進歩により人工音声による話者認識器詐称が危惧されている。本研究では、人工音声による話者認識機器詐称の対策手法に関し研究を進める。申請期間内に日本語の人工音声コーパスを作成し申請期間終了時に一般公開する。人工音声による話者認識器詐称の対策方法の高精度化を進めるため、人工音声と実音声の相違点を明確にするとともに、人工音声による話者認識器詐称の対策手法に関して、特徴量空間の観点および判別モデルの観点で研究を進め、高精度な詐称防止方法を確立させる。 2021年度までに日本音響学会により構築された「新聞記事読み上げ音声コーパス (JNAS)」を用いた「人工音声コーパス」の構築方法および音声データを確立し、構築したコーパスを用いた人工音声に対するi-vectorを用いた話者認識実験を実施した。実験結果より、人工音声がi-vectorおよび深層学習を用いたResNetを基盤とした話者認識器を高確率で詐称することが可能であることを明確にした。 2022年度では、話者認識の前に人工音声と実音声を判別することを検討した。人工音声と実音声の判別には深層学習を用いた。人工音声・実音声の判別には人工音声作成方法が既知の場合には高確率で判別可能であることを明確にしたが、未知の場合にはまだ検討が必要であることが明確になった。人工音声を判別し話者認識の前に棄却することにより、詐称者受理を軽減することも明確になった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
2022年度までに作成した人工音声コーパスの構築に時間がかかり、計画の遅れが生じ、その挽回を現在までにできていないことが遅れの大きな要因である。その遅れは期間内に挽回できず、研究期間の延長を行うことで研究予定を達成する。
|
今後の研究の推進方策 |
2023年度は、人工音声、実音声の判別と同時に話者認識を行う機構を検討する予定である。具体的には、深層学習の出力に実音声・人工音声判別と共に話者を識別を組み入れるマルチタスク出力を組み入れ、学習・認識をする予定にしている。また、新たな評価関数を取り入れ、人工音声・実音声識別に有効な距離空間を検討する予定である。
|
次年度使用額が生じた理由 |
本来ならば研究期間は2022年度までであったが、コロナ禍の影響で国際会議などに参加することが困難であったため、差額が生じてしまった。2023年度はコロナ禍の影響が少なくなったため、これまでの発表などを積極的に行うと同時にまとめなどで使用する予定である。また、半導体不測の影響などで購入が難しかった保存機器などに当てる予定である。
|