• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

全ベイズモデルに基づく音声認識システム学習のデータ無制約化

研究課題

研究課題/領域番号 17K20001
研究種目

挑戦的研究(萌芽)

配分区分基金
研究分野 人間情報学およびその関連分野
研究機関東京工業大学

研究代表者

篠崎 隆宏  東京工業大学, 工学院, 准教授 (80447903)

研究分担者 持橋 大地  統計数理研究所, 数理・推論研究系, 准教授 (80418508)
研究期間 (年度) 2017-06-30 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2018年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2017年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
キーワード音声認識 / 教師なし学習 / 半教師あり学習 / 強化学習 / ノンパラメトリックベイズ法 / 発音辞書 / 音声等認識 / 機械学習
研究成果の概要

音声認識を様々なタスクにおいて実用的なものとするためには、認識システムの学習において教師あり学習への依存度を減らし、システムをより自律的なものへとする必要がある。本研究では、ノンパラメトリックベイズ法と重み付き有限トランスデューサ技術を応用し、対応の無い音素データとテキストデータから、自動的に発音辞書を拡張する手法を提案した。また書き起こしテキストを用いずにEncoder-Decoder型の音声認識システム全体を方策関数として認識結果のスカラー評価値をもとにシステムを強化学習する方法について取り組み、学習効率を大幅に向上させる手法を提案した。

研究成果の学術的意義や社会的意義

人間は成長の過程でほとんど無意識のうちに平均して一日5単語以上を学習する優れた言語学習能力を持っている。それに対して現在の音声認識システムは教師あり学習に頼っておりシステム開発に多大な手間を必要とするとともに、日々生み出される新しい単語や小さなコミュニティ内でのみ使用される表現などを自動的に学習する能力を欠いている問題がある。人と機械の間での自然な音声対話の実現を目指し、本研究では自律的な学習技術の実現に取り組んだ。従来の教師あり学習に代わる教師なし学習や強化学習による学習手法を提案し、実験により有効性を示した。

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (45件)

すべて 2020 2019 2018 2017 その他

すべて 国際共同研究 (2件) 雑誌論文 (18件) (うち国際共著 3件、 査読あり 12件、 オープンアクセス 5件) 学会発表 (23件) (うち国際学会 2件) 図書 (1件) 備考 (1件)

  • [国際共同研究] JHU(米国)

    • 関連する報告書
      2018 実施状況報告書
  • [国際共同研究] Johns Hopkins University/Carnegie Mellon University/MERL(米国)

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] 音声認識の現状と将来2020

    • 著者名/発表者名
      篠崎隆宏
    • 雑誌名

      シミュレーション

      巻: 39

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Effective and Stable Neuron Model Optimization Based on Aggregated CMA-ES2019

    • 著者名/発表者名
      Xu Han、Shinozaki Takahiro、Kobayashi Ryota
    • 雑誌名

      ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

      巻: ICASSP 2019 ページ: 1264-1268

    • DOI

      10.1109/icassp.2019.8682825

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Cross-Domain Speaker Recognition using Cycle-Consistent Adversarial Networks2019

    • 著者名/発表者名
      Liu Yi、Zhuang Bairong、Li Zhiyu、Shinozaki Takahiro
    • 雑誌名

      Proc. APSIPA

      巻: - ページ: 2070-2074

    • DOI

      10.1109/apsipaasc47483.2019.9023042

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Efficient Free Keyword Detection Based on CNN and End-to-End Continuous DP-Matching2019

    • 著者名/発表者名
      Tanaka Tomohiro、Shinozaki Takahiro
    • 雑誌名

      Proc. ASRU

      巻: - ページ: 637-644

    • DOI

      10.1109/asru46091.2019.9004021

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Effective and Stable Neuron Model Optimization Based on Aggregated CMA-ES2019

    • 著者名/発表者名
      Xu Han, Takahiro Shinozaki, Ryota Kobayashi
    • 雑誌名

      Proc. IEEE ICASSP

      巻: - ページ: 1264-1268

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] Investigation of Attention-Based Multimodal Fusion and Maximum Mutual Information Objective for DSTC7 Track32019

    • 著者名/発表者名
      Bairong Zhuang, Wenbo Wang, Takahiro Shinozaki
    • 雑誌名

      Proc. DSTC7

      巻: -

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 自動音声認識技術と英語教育--仕組みと研究動向,今できること・できないこと--2019

    • 著者名/発表者名
      篠崎 隆宏
    • 雑誌名

      英語教育

      巻: 67 ページ: 40-41

    • 関連する報告書
      2018 実施状況報告書
  • [雑誌論文] Evolution-Strategy-Based Automation of System Development for High-Performance Speech Recognition2018

    • 著者名/発表者名
      Takafumi Moriya, Tomohiro Tanaka, Takahiro Shinozaki, Shinji Watanabe, Kevin Duh
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 27 号: 1 ページ: 77-88

    • DOI

      10.1109/taslp.2018.2871755

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Reward Only Training of Encoder-Decoder Digit Recognition Systems Based on Policy Gradient Methods2018

    • 著者名/発表者名
      Yilong Peng, Hayato Shibata, Takahiro Shinozaki
    • 雑誌名

      Proc. APSIPA

      巻: - ページ: 1934-1939

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] F-Measure Based End-To-End Optimization of Neural Network Keyword Detectors2018

    • 著者名/発表者名
      Tomohiro Tanaka, Takahiro Shinozaki
    • 雑誌名

      Proc. APSIPA

      巻: - ページ: 1456-1461

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Reinforcement Learning of Speech Recognition System Based on Policy Gradient and Hypothesis Selection2018

    • 著者名/発表者名
      Taku Kato, Takahiro Shinozaki
    • 雑誌名

      Proc. IEEE ICASSP

      巻: - ページ: 5759-5763

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] 音声認識仮説を用いたベイズ的半教師あり発音辞書学習の検討2018

    • 著者名/発表者名
      池下裕紀, 篠崎隆宏
    • 雑誌名

      日本音響学会2018年春季研究発表会講演論文集

      巻: - ページ: 123-124

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] 方策勾配法と仮説選択に基づくDNN音声認識システムの強化学習2018

    • 著者名/発表者名
      加藤拓, 篠崎隆宏
    • 雑誌名

      日本音響学会2018年春季研究発表会講演論文集

      巻: - ページ: 15-16

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] End-to-Endニューラル対話モデルにおける単語分散表現の比較検討2018

    • 著者名/発表者名
      鄭 崇輝,李 知雨,王 文博,庄 佰融,篠崎 隆宏
    • 雑誌名

      日本音響学会2018年春季研究発表会講演論文集

      巻: - ページ: 125-126

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] Evolution Strategy Based Automatic Tuning of Neural Machine Translation Systems2017

    • 著者名/発表者名
      Hao Qin, Takahiro Shinozaki, Kevin Duh
    • 雑誌名

      Proc. International Workshop on Spoken Language Translation (IWSLT)

      巻: - ページ: 120-128

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Comparative Analysis of Word Embedding Methods for DSTC6 End-to-End Conversation Modeling Track[C]2017

    • 著者名/発表者名
      Zhuang Bairong, Wang Wenbo, Li Zhiyu, Zheng Chonghui, Takahiro Shinozaki
    • 雑誌名

      Proc. Dialog System Technology Challenges (DSTC6)

      巻: - ページ: 1-5

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 英語学習者の発声自動評価を目的としたDNN音声認識システムの検討2017

    • 著者名/発表者名
      加藤 拓, 篠崎 隆宏
    • 雑誌名

      情報処理学会研究報告

      巻: Vol.2017-SLP-119 ページ: 1-4

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] ベイズ推論を用いた半教師あり学習の日本語適用2017

    • 著者名/発表者名
      池下裕紀, 篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig
    • 雑誌名

      情報処理学会研究報告

      巻: Vol.2017-SLP-118 ページ: 1-4

    • 関連する報告書
      2017 実施状況報告書
    • 国際共著
  • [学会発表] 二重相続進化戦略による音声認識システムの最適化2020

    • 著者名/発表者名
      日野 健人,木村 友祐,Dong Yue,篠崎 隆宏
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] CNNフロントエンドによる高速なEnd-to-End連続DPマッチングの実現2020

    • 著者名/発表者名
      田中 智宏,篠崎 隆宏
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Robust Multichannel End-to-End Speech Recognition Based on Multi-Output Densenet2020

    • 著者名/発表者名
      Zheng Chonghui, Shinozaki Takahiro
    • 学会等名
      情報処理学会 声言語情報処理研究会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 入力画像勾配を用いたモデル構造フリーな教師無し音源ローカライゼーション2019

    • 著者名/発表者名
      田中 智宏, 篠﨑隆宏
    • 学会等名
      日本音響学会2019年秋季研究発表会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] CNNフロントエンドによるEnd-to-End連続DPマッチングの高速化2019

    • 著者名/発表者名
      田中 智宏, 篠﨑 隆宏
    • 学会等名
      音声言語処理研究会(SLP)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 連続単語検出のための 2D-RNN を用いた End-to-EndDPマッチング2019

    • 著者名/発表者名
      田中智宏, 篠崎隆宏
    • 学会等名
      日本音響学会 2019年 春季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 連続対応検出ネットワークによる音声動画からの教師なし物体セグメンテーションおよび関連学習の検討2019

    • 著者名/発表者名
      田中智宏, 篠崎隆宏
    • 学会等名
      日本音響学会 2019年 春季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 大規模 End-to-End 音声認識システムの教師なし強化学習の実現に向けた検討2019

    • 著者名/発表者名
      PengYilong, 篠崎隆宏
    • 学会等名
      日本音響学会 2019年 春季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Analysis of Attention-Based Multimodal Fusion and Maximum Mutual Information Objective for DSTC7 Audio Visual Scene-Aware Dialog Track2019

    • 著者名/発表者名
      王 文博,庄 佰融,篠崎 隆宏
    • 学会等名
      日本音響学会 2019年 春季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] I-vector Domain Adaptation Using Cycle-Consistent Adversarial Networks for Speaker Recognition2019

    • 著者名/発表者名
      Yi Liu, Takahiro Shinozaki
    • 学会等名
      情報処理学会 SLP-126
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] マルチゲートGRUユニットを用いた2D-RNNによるEnd-to-End始終端フリー単語検出2018

    • 著者名/発表者名
      田中智宏, 篠崎隆宏
    • 学会等名
      情報処理学会 SLP-125
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Improving the audio visual scene-aware dialog system in DSTC7 by using attentional multimodal fusion and MMI objective2018

    • 著者名/発表者名
      Wenbo Wang,Bairong Zhuang,Takahiro Shinozaki
    • 学会等名
      情報処理学会 SLP-125
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 音声認識システムの教師なし強化学習における報酬と報酬ノイズの影響の検討2018

    • 著者名/発表者名
      PengYilong, 柴田駿人, 篠崎隆宏
    • 学会等名
      日本音響学会 2018年 秋季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 単語検出性能を目的関数とした単語検出器学習法の提案2018

    • 著者名/発表者名
      田中智宏, 篠崎隆宏
    • 学会等名
      日本音響学会 2018年 秋季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 強化学習による報酬のみを用いたend-to-end 認識システム学習2018

    • 著者名/発表者名
      柴田駿人, PengYilong, 篠崎隆宏
    • 学会等名
      日本音響学会 2018年 秋季研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] End-to-end音声認識システムの強化学習の検討2018

    • 著者名/発表者名
      PengYilong, 柴田駿人, 篠崎隆宏
    • 学会等名
      情報処理学会 SLP-123
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 音声認識仮説を用いたベイズ的半教師あり発音辞書学習の検討2018

    • 著者名/発表者名
      池下 裕紀
    • 学会等名
      日本音響学会春季研究発表会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] 方策勾配法と仮説選択に基づくDNN音声認識システムの強化学習2018

    • 著者名/発表者名
      加藤 拓
    • 学会等名
      日本音響学会春季研究発表会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] End-to-Endニューラル対話モデルにおける単語分散表現の比較検討2018

    • 著者名/発表者名
      鄭 崇輝
    • 学会等名
      日本音響学会春季研究発表会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] Evolution Strategy Based Automatic Tuning of Neural Machine Translation Systems2017

    • 著者名/発表者名
      Hao Qin
    • 学会等名
      International Workshop on Spoken Language Translation
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] Comparative Analysis of Word Embedding Methods for DSTC6 End-to-End Conversation Modeling Track[C]2017

    • 著者名/発表者名
      Zhuang Bairong
    • 学会等名
      Dialog System Technology Challenges (DSTC6)
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] 英語学習者の発声自動評価を目的としたDNN音声認識システムの検討2017

    • 著者名/発表者名
      加藤 拓
    • 学会等名
      情報処理学会音声言語情報処理研究会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] ベイズ推論を用いた半教師あり学習の日本語適用2017

    • 著者名/発表者名
      池下 裕紀
    • 学会等名
      情報処理学会音声言語情報処理研究会
    • 関連する報告書
      2017 実施状況報告書
  • [図書] Automated Development of DNN Based Spoken Language Systems Using Evolutionary Algorithms2020

    • 著者名/発表者名
      Takahiro Shinozaki, Shinji Watanabe, Kevin Duh
    • 総ページ数
      33
    • 出版者
      Springer
    • 関連する報告書
      2019 実績報告書
  • [備考] 篠崎研究室

    • 関連する報告書
      2019 実績報告書

URL: 

公開日: 2017-07-21   更新日: 2022-02-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi