2023 Fiscal Year Annual Research Report
Privacy preserved acoustic-falsification detection and speaker verification
Project/Area Number |
18K18052
|
Research Institution | Shimane University |
Principal Investigator |
黄 緒平 島根大学, 学術研究院理工学系, 准教授 (20734114)
|
Project Period (FY) |
2018-04-01 – 2024-03-31
|
Keywords | 電子透かし / 改ざん検出 / 成りすまし検出 / プライバシー保護 / 音声信号処理 / 耐タンパ性 / スペクトル解析 / 音声匿名化 |
Outline of Annual Research Achievements |
生成系AIの発展により、声紋から声を生成する技術や特定の人物の声を近似して再現できる音声合成に関する研究が盛んに行われた。生成系AIの発展により、公共放送を含む公共の場で録音した音声サンプルを用いて、発話者の声を模擬・再現・発声・変声させることで,個人の許可を得ず他者なりすますことができるようになった。また、本人の意図せずに原音そっくりの声によるコンテンツ改ざんができるようになった。本研究では、高音質を維持しながら、人間聴覚システムにおいて知覚しにくい周波数帯域に、原音の電子署名のダイジェスト情報を無損失かつ完全に復元できる電子透かし手法を提案することによって、改ざん検出及び話者識別を含むデータの真正性の保証を実現した。 最終年度においては、データの完全復元可能な整数コサイン変換アルゴリズムを適応し、提案手法の最適な埋め込み箇所を探る方式を提案した。また、埋め込み容量等のパラメータにおいて音質ベンチマークを用いて音質評価を行った。その結果をまとめて、ジャーナル論文1件が採録された。 研究期間全体を通じて、音声コンテンツの偽造の検出、話者の成りすましを高精度に識別出来る電子透かし手法を新たに提案した。攻撃への耐性を考慮しながら埋め込み領域をアダプティブに選定し,原音に依存せず話者成りすましの判別とデータの真偽をブラインドかつ高精度に検出できる電子透かし手法を確立した。また、非可逆圧縮を16bitに量子化したデータの8ビット位まで可変的にかつ部分的に適応することによって、可逆な電子透かし手法を実現した。また、ラプラスノイズ及びガウシアンノイズ等を用い、声紋に雑音摂動することによって、高音質を維持しながら、本人の声紋が特定されない声紋匿名手法も提案した。
|