• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模コーパスを利用した音声・音響信号の自動分類と音声認識への応用

研究課題

研究課題/領域番号 25330183
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理
研究機関山形大学

研究代表者

小坂 哲夫  山形大学, 理工学研究科, 教授 (50359569)

連携研究者 加藤 正治  山形大学, 大学院理工学研究科, 助教 (10250953)
研究期間 (年度) 2013-04-01 – 2016-03-31
研究課題ステータス 完了 (2015年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2015年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2014年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2013年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
キーワード音声認識 / 音響モデル / クラスタリング / 隠れマルコフモデル / ディープニューラルネットワーク / ディープニューラルネット / 話者適応 / 話者 / 音声コーパス
研究成果の概要

音声コーパスの拡大および計算機の性能向上により,音声認識の高性能化が図られている.しかし音声や音響信号には話者性や背景雑音など多様性があり,それが認識率低下の原因ともなっている.本研究ではクラスタリング技術を用い,音声・音響信号の多様性による音声認識の性能劣化の問題に取り組んだ.
本研究では日本語大規模音声コーパスを用い,性質の類似した信号をクラス別にまとめ,クラスごとにモデルを構築し音声認識の性能向上を図った.研究ではガウス混合分布(GMM)ベースのモデルのみならず近年注目されているディープニューラルネットワーク(DNN)も用い検討した.

報告書

(4件)
  • 2015 実績報告書   研究成果報告書 ( PDF )
  • 2014 実施状況報告書
  • 2013 実施状況報告書
  • 研究成果

    (18件)

すべて 2016 2015 2014 2013 その他

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 2件、 謝辞記載あり 2件) 学会発表 (12件) 図書 (1件) 備考 (1件)

  • [雑誌論文] Deep Neural Network-Based Speech Recognition with Combination of Speaker-Class Models2015

    • 著者名/発表者名
      Tetsuo Kosaka, Kazuki Konno, Masaharu Kato
    • 雑誌名

      Proc. of APSIPA ASC 2015

      巻: SP2-2.3 ページ: 1-4

    • DOI

      10.1109/apsipa.2015.7415464

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Unsupervised cross-adaptation using language model and deep learning based acoustic model adaptations2014

    • 著者名/発表者名
      Akira Takagi, Kazuki Konno, Masaharu Kato and Tetsuo Kosaka
    • 雑誌名

      Proc. of APSIPA ASC 2014

      巻: WA-P-16 ページ: 1-4

    • DOI

      10.1109/apsipa.2014.7041581

    • 関連する報告書
      2014 実施状況報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] 話者クラス音響モデル及び単語グラフ統合を用いた音声認識2013

    • 著者名/発表者名
      小坂哲夫,伊藤貴,加藤正治 ,好田正紀
    • 雑誌名

      電子情報通信学会論文誌,

      巻: Vol. J96-D, No. 11 ページ: 2795-2803

    • NAID

      110009661670

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [雑誌論文] Speech recognition with large-scale speaker-class-based acoustic modeling2013

    • 著者名/発表者名
      Kazuki Konno, Masaharu Kato and Tetsuo Kosaka
    • 雑誌名

      Proc. of APSIPA ASC 2013

      巻: OS.28-SLA..9, 113 ページ: 1-4

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [学会発表] ディープニューラルネットワークを用いた映画中の音声区間検出の検討2016

    • 著者名/発表者名
      菅郁巳, 安原龍, 井上雅史, 小坂哲夫
    • 学会等名
      日本音響学会春季講演論文集
    • 発表場所
      桐蔭横浜大学
    • 年月日
      2016-03-09
    • 関連する報告書
      2015 実績報告書
  • [学会発表] ディープニューラルネットによる話者クラス音響モデルを用いた音声認識2015

    • 著者名/発表者名
      今野和樹,加藤正治,小坂哲夫
    • 学会等名
      日本音響学会秋季講演論文集
    • 発表場所
      会津大学
    • 年月日
      2015-09-16
    • 関連する報告書
      2015 実績報告書
  • [学会発表] DNN-HMMを用いた教師なしクロス適応の性能改善の検討2015

    • 著者名/発表者名
      高木瑛, 加藤正治, 小坂哲夫
    • 学会等名
      日本音響学会春季講演論文集
    • 発表場所
      中央大学後楽園キャンパス
    • 年月日
      2015-03-16 – 2015-03-18
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] 最尤推定による話者クラスDNNの出力統合を用いた音声認識2015

    • 著者名/発表者名
      今野和樹,加藤正治,小坂哲夫
    • 学会等名
      日本音響学会春季講演論文集
    • 発表場所
      中央大学後楽園キャンパス
    • 年月日
      2015-03-16 – 2015-03-18
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] DNN-HMMを用いた音声認識におけるパラメータ数の検討2015

    • 著者名/発表者名
      小野瑞穂, 加藤正治, 小坂哲夫
    • 学会等名
      情報処理学会東北支部研究会
    • 発表場所
      山形大学工学部
    • 年月日
      2015-03-04
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] Deep Learningによる教師つき適応の結果を用いた日本語講演音声認識の誤り解析2014

    • 著者名/発表者名
      小野瑞穂,小関翔太,加藤正治,小坂哲夫
    • 学会等名
      日本音響学会秋季講演論文集
    • 発表場所
      北海学園大学豊平キャンパス
    • 年月日
      2014-09-03 – 2014-09-05
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] 音声認識におけるDNNを用いた話者クラスモデルの検討2014

    • 著者名/発表者名
      今野和樹,高木 瑛,加藤正治,小坂哲夫
    • 学会等名
      電気関係学会東北支部連合大会
    • 発表場所
      山形大学工学部
    • 年月日
      2014-08-21 – 2014-08-22
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] DNN-HMMを用いた音響モデルおよび言語モデルのクロス適応2014

    • 著者名/発表者名
      高木瑛, 今野和樹, 加藤正治, 小坂哲夫
    • 学会等名
      情報処理学会声言語情報処理研究報告
    • 発表場所
      東京工業大学 大岡山キャンパス
    • 年月日
      2014-05-22 – 2014-05-23
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] DNN-HMMを用いた日本語講演音声認識における話者適応の検討2014

    • 著者名/発表者名
      小坂哲夫, 今野和樹, 高木瑛, 加藤正治
    • 学会等名
      日本音響学会春季講演論文集
    • 発表場所
      日本大学理工学部
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] 大規模話者クラス音響モデルを用いた音声認識の精度向上の検討2013

    • 著者名/発表者名
      今野和樹, 加藤正治, 小坂哲夫
    • 学会等名
      日本音響学会講演論文集
    • 発表場所
      豊橋技術科学大学
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] 単語グラフを用いた音声アライメント2013

    • 著者名/発表者名
      加藤正治, 小坂哲夫
    • 学会等名
      日本音響学会講演論文集
    • 発表場所
      豊橋技術科学大学
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] 雑音重複区間のモデル化による音声区間検出の性能向上

    • 著者名/発表者名
      佐々木志貢, 加藤正治, 小坂哲夫
    • 学会等名
      情報処理学会東北支部研究会
    • 発表場所
      山形大学工学部
    • 関連する報告書
      2013 実施状況報告書
  • [図書] 進化するヒトと機械の音声コミュニケーション第1編2章2015

    • 著者名/発表者名
      小坂哲夫
    • 総ページ数
      10
    • 出版者
      (株)ニッケイ印刷
    • 関連する報告書
      2014 実施状況報告書
  • [備考] 小坂研究室ホームページ

    • URL

      http://speech-lab.yz.yamagata-u.ac.jp/

    • 関連する報告書
      2015 実績報告書

URL: 

公開日: 2014-07-25   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi