• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

長期間収録音声コーパスに基づく話者内音声変動に頑健な話者認識手法の研究

Research Project

Project/Area Number 21300060
Research InstitutionChiba University

Principal Investigator

黒岩 眞吾  千葉大学, 融合科学研究科(研究院), 教授 (20333510)

Co-Investigator(Kenkyū-buntansha) 柘植 覚  大同大学, 情報学部, 准教授 (00325250)
長内 隆  科学警察研究所, 法科学第四部, 部付主任研究官 (70392264)
篠崎 隆宏  東京工業大学, 総合理工学研究科(研究院), 准教授 (80447903)
Project Period (FY) 2009-04-01 – 2014-03-31
Keywords話者認識 / 話者照合 / 話者識別 / 話者内音声変動 / 長期間収録音声コーパス / AWA-LTR / 法科学 / 音声特徴量
Research Abstract

(1)音声コーパスの構築:少数話者の長・短期間音声コーパスである『AWA長期間収録音声コーパス』として、1名の話者の週 1回、朝・昼・夕、各15分の収録を実施した。また、国立情報学研究所(NII)の支援により現在までに収録した話者7名、収録期間2年~10年のコーパス化を進めた(2014年度中にNIIを通じ公開・配布の予定)。また、同コーパスのホームページを作成した。
(2)話者性の抽出及び話者内音声変動のモデル化:話者内音声変動モデルをGMM-SVM法に適用し有効性を確認した。さらに、音素毎に部分空間を構成し話者内音声変動をモデル化する手法を構築しテキスト指定型話者照合で有効性を確認した。また、『AWA長期間収録音声コーパス』の詳細な分析を行い、長期的な音声変動以外にも、朝・昼・夕、発声開始時と10分程度発声を続けた後での変動を観測した。また、話者が感情を込めて発声した音声を収集し特徴量の変化を調査すると共に感情認識手法も検討した。
(3)計算量にとらわれない高精度かつ頑健な新しい話者認識手法の検討:昨年度提案した、深層学習に基づくニューラルネットワークを用いた残響に頑健な特徴抽出手法の有効性を確認すると共に、NIST-SREタスクにおいてi-vectorとニューラルネットを統合した新たな話者認識手法の検討を行った。また、重なりを含む3者対話音声における特定話者の発声区間検出タスクで、照合・適応の繰り返し手法を提案し精度の向上を確認した。さらに、Missing Feature Theoryを用いた少ない音声データにも頑健な話者照合手法を提案した。
(4)法科学における話者照合の有効性の検討:法科学分野における話者認識において、人間の聴覚及び視覚による話者認識性能と機械による認識性能を比較し、その特徴を明らかとした。また、母語話者・非母語話者の識別手法及び性別識別手法でプロソディ情報の有効性を示すと共に、母音の無性化等、話者の出身地を識別可能な特徴を明らかにした。

Current Status of Research Progress
Reason

25年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

25年度が最終年度であるため、記入しない。

  • Research Products

    (22 results)

All 2014 2013 Other

All Journal Article (6 results) (of which Peer Reviewed: 3 results) Presentation (15 results) Remarks (1 results)

  • [Journal Article] 多数話者による単独発話母音から抽出したフォルマント周波数の特性2014

    • Author(s)
      鎌田敏明, 蒔苗久則, 網野加苗, 長内隆
    • Journal Title

      科学警察研究所報告

      Volume: Vol. 63, No. 1 Pages: 19-23

    • Peer Reviewed
  • [Journal Article] 発話中の一部区間を用いた感情認識2014

    • Author(s)
      内田正洋, 篠崎隆宏, 堀内靖雄, 黒岩眞吾
    • Journal Title

      電子情報通信学会論文誌

      Volume: Vol. J97-D, No.1 Pages: 236-238

    • Peer Reviewed
  • [Journal Article] Native vs. non-native accent identification using Japanese spoken telephone numbers2014

    • Author(s)
      Kanae Amino, Takashi Osanai
    • Journal Title

      Speech Communication

      Volume: 56 Pages: 70-81

    • DOI

      10.1016/j.specom.2013.07.010

    • Peer Reviewed
  • [Journal Article] 法科学分野における話者認識の動向2013

    • Author(s)
      長内隆, 石原俊一
    • Journal Title

      日本音響学会誌

      Volume: vol. 69, No.7 Pages: 365-370

  • [Journal Article] 小特集「話者認識に関する研究の動向」にあたって2013

    • Author(s)
      黒岩眞吾
    • Journal Title

      日本音響学会誌

      Volume: 69 Pages: 340-341

  • [Journal Article] 話者認識におけるロバストネス2013

    • Author(s)
      王龍標, 西田昌史, 柘植覚, 網野加苗
    • Journal Title

      日本音響学会誌

      Volume: 69 Pages: 357-364

  • [Presentation] AWA長期間収録音声コーパスを利用した時期差の分析2014

    • Author(s)
      中原悠佑,堀内靖雄,黒岩眞吾
    • Organizer
      電子情報通信学会総合大会
    • Place of Presentation
      新潟大学
    • Year and Date
      20140319-20140322
  • [Presentation] 腕時計型スマートデバイスにおける音声GUIの有効性の検討2014

    • Author(s)
      山本宗典,篠崎隆宏,堀内靖雄,黒岩眞吾
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学(駿河台キャンパス)
    • Year and Date
      20140310-20140312
  • [Presentation] 疑似アナウンスモデルを用いた構内雑音環境下音声区間検出法2014

    • Author(s)
      江連哲,堀内靖雄,黒岩眞吾
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学(駿河台キャンパス)
    • Year and Date
      20140310-20140312
  • [Presentation] 混合音声モデルを用いた話者インデキシング2014

    • Author(s)
      赤岩祐真,堀内靖雄,黒岩眞吾
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学(駿河台キャンパス)
    • Year and Date
      20140310-20140312
  • [Presentation] 同一話者内における母音の無声化の再現性2014

    • Author(s)
      網野加苗, 蒔苗久則, 鎌田敏明,長内隆
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学(駿河台キャンパス)
    • Year and Date
      20140310-20140312
  • [Presentation] ハードウエア音声認識研究のためのプラットフォームFPGA基板2014

    • Author(s)
      永谷 悠,李 昊霖,篠崎 隆宏,堀内 靖雄,黒岩 眞吾
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学(駿河台キャンパス)
    • Year and Date
      20140310-20140312
  • [Presentation] Missing feature theory for speaker verification with short utterances2014

    • Author(s)
      Yoko Takahashi, Shingo Kuroiwa, Yasuo Horiuchi, Satoru Tsuge
    • Organizer
      2014 International Workshop on Nonlinear Circuits, Communication and Signal Processing
    • Place of Presentation
      Honolulu, U.S.A.
    • Year and Date
      20140228-20140303
  • [Presentation] 連続音声を対象とした音響特徴量間の性別識別性能の比較2013

    • Author(s)
      長内隆, 網野加苗, 鎌田敏明, 蒔苗久則
    • Organizer
      日本法科学技術学会 第19回学術集会
    • Place of Presentation
      ホテルフロラシオン青山
    • Year and Date
      20131114-20131115
  • [Presentation] Spoken document retrieval using both word-based and syllable-based document spaces with latent semantic indexing2013

    • Author(s)
      Ken Ichikawa, Satoru Tsuge, Norihide Kitaoka, Kazuya Takeda, Kenji Kita
    • Organizer
      APSIPA Annual Summit and Conference 2013
    • Place of Presentation
      Kaohsiung, Taiwan
    • Year and Date
      20131029-20131101
  • [Presentation] Reverberant Speech Recognition Based on Denoising Autoencoder2013

    • Author(s)
      Takaaki Ishii, Hiroki Komiyama, Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa
    • Organizer
      Interspeech 2013
    • Place of Presentation
      Lyon, France
    • Year and Date
      20130925-20130929
  • [Presentation] Denoising Autoencoderによる残響除去の大語彙音声認識における評価2013

    • Author(s)
      小宮山大樹,篠崎隆宏,堀内靖雄,黒岩眞吾
    • Organizer
      日本音響学会2013年秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] 眼電位入力音声合成インタフェースのためのコンテキスト依存眼動素を用いた眼電位認識2013

    • Author(s)
      房福明,篠崎隆宏,古井貞煕,堀内靖雄,黒岩眞吾
    • Organizer
      日本音響学会2013年秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] 本人および両親の出身地が母音の無声化率に与える影響2013

    • Author(s)
      網野加苗, 蒔苗久則, 鎌田敏明,長内隆
    • Organizer
      日本音響学会2013年秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] 音声ドキュメント検索手法における拡張クエリの超平面によるモデル化と潜在意味解析の適用2013

    • Author(s)
      市川賢, 柘植覚, 北岡教英, 武田一哉, 北研二
    • Organizer
      日本音響学会2013年秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] Denoising Autoencoderを用いた残響下大語彙音声認識の検討2013

    • Author(s)
      小宮山大樹,石井敬章, 篠崎隆宏,堀内靖雄,黒岩眞吾
    • Organizer
      情報処理学会 音声言語処理研究会
    • Place of Presentation
      遠刈田温泉 壮鳳
    • Year and Date
      20130718-20130718
  • [Remarks] AWA長期間収録音声コーパス

    • URL

      http://www.ailab.tj.chiba-u.jp/kuro/AWA-LTR/

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi