2012 Fiscal Year Annual Research Report

音声言語情報に含まれるプライバシ情報の保護に関する研究

Research Project

Project/Area Number	22650034
Research Institution	Toyohashi University of Technology
Principal Investigator	中川聖一豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)
Co-Investigator(Kenkyū-buntansha)	山本一公豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230) 土屋雅稔豊橋技術科学大学, 学内共同利用施設等(情報メディア基盤センター), 助教 (70378256)
Project Period (FY)	2010-04-01 – 2013-03-31
Keywords	プライバシ保護 / 音声認識 / 人名抽出 / 人名除去 / 固有名認識 / 個人情報
Research Abstract	音声中のプライバシ情報を保護するためには、発声者の隠蔽（声質変換）とプライバシに関する内容の除去が必要である。平成24年度は、プライバシの代表的な情報である人名の抽出とその部分の音声除去に取り組んだ。これは、大語彙連続音声認識で人名と認識された区間を除去すれば、目的が達成できるわけではない。その理由は音声認識誤りと、音声認識用の辞書に含まれていない人名は認識できないことによる。そこで、人名の抽出精度を上げ、抽出漏れを極力減らす方法を提案した。そのため、①大語彙連続音声認識における言語モデルで、人名の出現予測確率を大きくすることで人名の認識漏れを防ぐ方法、②類似した発音の人名が辞書に存在するように辞書に登録する人名を増加させ、人名は発音の類似した人名に誤認識されるようにする方法、③新しく登録した人名の予測確率を与えるためにクラス言語モデルを導入する方法、④辞書に存在しない人名は任意の音節列として認識する方法、を検討した。 NHKのニュース音声を対象に、人名の抽出実験を行った。本研究の目的は、人名を正しく抽出することであり、他の人名に誤認識となっても正解とした。ベースラインで、辞書に存在しない人名の再現率14％、精度2％であったものが、上述の４手法を併用することにより、再現率87％、精度12％に向上した。これは、ニュース音声中の人名の出現率は約1％であることから、1000単語中（人名が10単語）、人名として80単語抽出し、そのうち、9単語が正しい人名であったということに対応する。音声の10％程度が誤っても（欠如しても）、意味的にはほぼ正しく理解できることから、本手法は、初期の目標を達成したと言える。勿論、実用的には、再現率を100％に近づける必要はあるが、音声認識システムの向上により、可能になっていくと考えられる。
Current Status of Research Progress	Reason 24年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	24年度が最終年度であるため、記入しない。

Research Products
(6 results)

All 2013 2012 Other

All Journal Article (1 results) Presentation (4 results) Book (1 results)

[Journal Article] Class-based n-gram language Model for new words using out-of-vocabulary to in-vocabulary similarity2012
- Author(s)
  W. Naptali, M. Tsuchiya, S. Nakagawa
- Journal Title
  
  IEICE Trans. Inf. & Syst.
  
  Volume: Vol.E95-D, No.9 Pages: 2308-2316
- DOI
  10.1587/transinf.E95.D.2308
[Presentation] ケプストラム距離に基づくNMFの高速化手法とVQ手法による音楽重畳音声の認識
- Author(s)
  仲野翔一，山本一公, 中川聖一
- Organizer
  日本音響学会 2013年春季研究発表会
- Place of Presentation
  東京工科大学八王子キャンパス
[Presentation] 音声ドキュメント中の人名抽出
- Author(s)
  川口亮，土屋雅稔，中川聖一
- Organizer
  日本音響学会 2013年春季研究発表会
- Place of Presentation
  東京工科大学八王子キャンパス
[Presentation] Fast NMF based approach and improved VQ based approach for speech recognition from mixed sound
- Author(s)
  S. Nakano, K. Yamamoto, S. Nakagawa
- Organizer
  Proc. APSIPA
- Place of Presentation
  Loews Hollywood Hotel, California, USA
[Presentation] Improving distant speaker identification robustness using a non-linear regression based dereverberation method in feature domain
- Author(s)
  A. A. Nugraha, S. Nakagawa
- Organizer
  日本音響学会 2012年秋季研究発表会
- Place of Presentation
  信州大学工学部（長野市）
[Book] 音声言語処理と自然言語処理2013
- Author(s)
  中川聖一，小林聡，峯松信明，宇津呂武仁，秋葉友良，北岡教英，山本幹雄，甲斐充彦，山本一公，土屋雅稔
- Total Pages
  264
- Publisher
  コロナ社

2012 Fiscal Year Annual Research Report

音声言語情報に含まれるプライバシ情報の保護に関する研究

Principal Investigator

中川 聖一 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)

Reason

Research Products

[Journal Article] Class-based n-gram language Model for new words using out-of-vocabulary to in-vocabulary similarity2012

Author(s)

Journal Title

DOI

[Presentation] ケプストラム距離に基づくNMFの高速化手法とVQ手法による音楽重畳音声の認識

Author(s)

Organizer

Place of Presentation

[Presentation] 音声ドキュメント中の人名抽出

Author(s)

Organizer

Place of Presentation

[Presentation] Fast NMF based approach and improved VQ based approach for speech recognition from mixed sound

Author(s)

Organizer

Place of Presentation

[Presentation] Improving distant speaker identification robustness using a non-linear regression based dereverberation method in feature domain

Author(s)

Organizer

Place of Presentation

[Book] 音声言語処理と自然言語処理2013

Author(s)

Total Pages

Publisher

中川聖一豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)