• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

長期間収録音声コーパスに基づく話者内音声変動に頑健な話者認識手法の研究

研究課題

研究課題/領域番号 21300060
研究機関千葉大学

研究代表者

黒岩 眞吾  千葉大学, 融合科学研究科(研究院), 教授 (20333510)

研究分担者 柘植 覚  大同大学, 情報学部, 准教授 (00325250)
長内 隆  科学警察研究所, 法科学第四部, 部付主任研究官 (70392264)
篠崎 隆宏  東京工業大学, 総合理工学研究科(研究院), 准教授 (80447903)
研究期間 (年度) 2009-04-01 – 2014-03-31
キーワード話者認識 / 話者照合 / 話者識別 / 話者内音声変動 / 長期間収録音声コーパス / AWA-LTR / 法科学 / 音声特徴量
研究概要

(1)音声コーパスの構築:少数話者の長・短期間音声コーパスである『AWA長期間収録音声コーパス』として、1名の話者の週 1回、朝・昼・夕、各15分の収録を実施した。また、国立情報学研究所(NII)の支援により現在までに収録した話者7名、収録期間2年~10年のコーパス化を進めた(2014年度中にNIIを通じ公開・配布の予定)。また、同コーパスのホームページを作成した。
(2)話者性の抽出及び話者内音声変動のモデル化:話者内音声変動モデルをGMM-SVM法に適用し有効性を確認した。さらに、音素毎に部分空間を構成し話者内音声変動をモデル化する手法を構築しテキスト指定型話者照合で有効性を確認した。また、『AWA長期間収録音声コーパス』の詳細な分析を行い、長期的な音声変動以外にも、朝・昼・夕、発声開始時と10分程度発声を続けた後での変動を観測した。また、話者が感情を込めて発声した音声を収集し特徴量の変化を調査すると共に感情認識手法も検討した。
(3)計算量にとらわれない高精度かつ頑健な新しい話者認識手法の検討:昨年度提案した、深層学習に基づくニューラルネットワークを用いた残響に頑健な特徴抽出手法の有効性を確認すると共に、NIST-SREタスクにおいてi-vectorとニューラルネットを統合した新たな話者認識手法の検討を行った。また、重なりを含む3者対話音声における特定話者の発声区間検出タスクで、照合・適応の繰り返し手法を提案し精度の向上を確認した。さらに、Missing Feature Theoryを用いた少ない音声データにも頑健な話者照合手法を提案した。
(4)法科学における話者照合の有効性の検討:法科学分野における話者認識において、人間の聴覚及び視覚による話者認識性能と機械による認識性能を比較し、その特徴を明らかとした。また、母語話者・非母語話者の識別手法及び性別識別手法でプロソディ情報の有効性を示すと共に、母音の無性化等、話者の出身地を識別可能な特徴を明らかにした。

現在までの達成度 (区分)
理由

25年度が最終年度であるため、記入しない。

今後の研究の推進方策

25年度が最終年度であるため、記入しない。

  • 研究成果

    (22件)

すべて 2014 2013 その他

すべて 雑誌論文 (6件) (うち査読あり 3件) 学会発表 (15件) 備考 (1件)

  • [雑誌論文] 多数話者による単独発話母音から抽出したフォルマント周波数の特性2014

    • 著者名/発表者名
      鎌田敏明, 蒔苗久則, 網野加苗, 長内隆
    • 雑誌名

      科学警察研究所報告

      巻: Vol. 63, No. 1 ページ: 19-23

    • 査読あり
  • [雑誌論文] 発話中の一部区間を用いた感情認識2014

    • 著者名/発表者名
      内田正洋, 篠崎隆宏, 堀内靖雄, 黒岩眞吾
    • 雑誌名

      電子情報通信学会論文誌

      巻: Vol. J97-D, No.1 ページ: 236-238

    • 査読あり
  • [雑誌論文] Native vs. non-native accent identification using Japanese spoken telephone numbers2014

    • 著者名/発表者名
      Kanae Amino, Takashi Osanai
    • 雑誌名

      Speech Communication

      巻: 56 ページ: 70-81

    • DOI

      10.1016/j.specom.2013.07.010

    • 査読あり
  • [雑誌論文] 法科学分野における話者認識の動向2013

    • 著者名/発表者名
      長内隆, 石原俊一
    • 雑誌名

      日本音響学会誌

      巻: vol. 69, No.7 ページ: 365-370

  • [雑誌論文] 小特集「話者認識に関する研究の動向」にあたって2013

    • 著者名/発表者名
      黒岩眞吾
    • 雑誌名

      日本音響学会誌

      巻: 69 ページ: 340-341

  • [雑誌論文] 話者認識におけるロバストネス2013

    • 著者名/発表者名
      王龍標, 西田昌史, 柘植覚, 網野加苗
    • 雑誌名

      日本音響学会誌

      巻: 69 ページ: 357-364

  • [学会発表] AWA長期間収録音声コーパスを利用した時期差の分析2014

    • 著者名/発表者名
      中原悠佑,堀内靖雄,黒岩眞吾
    • 学会等名
      電子情報通信学会総合大会
    • 発表場所
      新潟大学
    • 年月日
      20140319-20140322
  • [学会発表] 腕時計型スマートデバイスにおける音声GUIの有効性の検討2014

    • 著者名/発表者名
      山本宗典,篠崎隆宏,堀内靖雄,黒岩眞吾
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学(駿河台キャンパス)
    • 年月日
      20140310-20140312
  • [学会発表] 疑似アナウンスモデルを用いた構内雑音環境下音声区間検出法2014

    • 著者名/発表者名
      江連哲,堀内靖雄,黒岩眞吾
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学(駿河台キャンパス)
    • 年月日
      20140310-20140312
  • [学会発表] 混合音声モデルを用いた話者インデキシング2014

    • 著者名/発表者名
      赤岩祐真,堀内靖雄,黒岩眞吾
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学(駿河台キャンパス)
    • 年月日
      20140310-20140312
  • [学会発表] 同一話者内における母音の無声化の再現性2014

    • 著者名/発表者名
      網野加苗, 蒔苗久則, 鎌田敏明,長内隆
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学(駿河台キャンパス)
    • 年月日
      20140310-20140312
  • [学会発表] ハードウエア音声認識研究のためのプラットフォームFPGA基板2014

    • 著者名/発表者名
      永谷 悠,李 昊霖,篠崎 隆宏,堀内 靖雄,黒岩 眞吾
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学(駿河台キャンパス)
    • 年月日
      20140310-20140312
  • [学会発表] Missing feature theory for speaker verification with short utterances2014

    • 著者名/発表者名
      Yoko Takahashi, Shingo Kuroiwa, Yasuo Horiuchi, Satoru Tsuge
    • 学会等名
      2014 International Workshop on Nonlinear Circuits, Communication and Signal Processing
    • 発表場所
      Honolulu, U.S.A.
    • 年月日
      20140228-20140303
  • [学会発表] 連続音声を対象とした音響特徴量間の性別識別性能の比較2013

    • 著者名/発表者名
      長内隆, 網野加苗, 鎌田敏明, 蒔苗久則
    • 学会等名
      日本法科学技術学会 第19回学術集会
    • 発表場所
      ホテルフロラシオン青山
    • 年月日
      20131114-20131115
  • [学会発表] Spoken document retrieval using both word-based and syllable-based document spaces with latent semantic indexing2013

    • 著者名/発表者名
      Ken Ichikawa, Satoru Tsuge, Norihide Kitaoka, Kazuya Takeda, Kenji Kita
    • 学会等名
      APSIPA Annual Summit and Conference 2013
    • 発表場所
      Kaohsiung, Taiwan
    • 年月日
      20131029-20131101
  • [学会発表] Reverberant Speech Recognition Based on Denoising Autoencoder2013

    • 著者名/発表者名
      Takaaki Ishii, Hiroki Komiyama, Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa
    • 学会等名
      Interspeech 2013
    • 発表場所
      Lyon, France
    • 年月日
      20130925-20130929
  • [学会発表] Denoising Autoencoderによる残響除去の大語彙音声認識における評価2013

    • 著者名/発表者名
      小宮山大樹,篠崎隆宏,堀内靖雄,黒岩眞吾
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      20130925-20130927
  • [学会発表] 眼電位入力音声合成インタフェースのためのコンテキスト依存眼動素を用いた眼電位認識2013

    • 著者名/発表者名
      房福明,篠崎隆宏,古井貞煕,堀内靖雄,黒岩眞吾
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      20130925-20130927
  • [学会発表] 本人および両親の出身地が母音の無声化率に与える影響2013

    • 著者名/発表者名
      網野加苗, 蒔苗久則, 鎌田敏明,長内隆
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      20130925-20130927
  • [学会発表] 音声ドキュメント検索手法における拡張クエリの超平面によるモデル化と潜在意味解析の適用2013

    • 著者名/発表者名
      市川賢, 柘植覚, 北岡教英, 武田一哉, 北研二
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      20130925-20130927
  • [学会発表] Denoising Autoencoderを用いた残響下大語彙音声認識の検討2013

    • 著者名/発表者名
      小宮山大樹,石井敬章, 篠崎隆宏,堀内靖雄,黒岩眞吾
    • 学会等名
      情報処理学会 音声言語処理研究会
    • 発表場所
      遠刈田温泉 壮鳳
    • 年月日
      20130718-20130718
  • [備考] AWA長期間収録音声コーパス

    • URL

      http://www.ailab.tj.chiba-u.jp/kuro/AWA-LTR/

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi