• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

語彙レベル韻律情報の高精度予測に基づく大語彙連続音声認識の高精度化

研究課題

研究課題/領域番号 25540064
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 知覚情報処理
研究機関東京大学

研究代表者

峯松 信明  東京大学, 工学(系)研究科(研究院), 教授 (90273333)

研究期間 (年度) 2013-04-01 – 2016-03-31
研究課題ステータス 完了 (2015年度)
配分額 *注記
3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2014年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2013年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード音声認識 / 韻律的特徴 / アクセント句境界 / アクセント核位置 / リランキング / Average perceptron / CRF / 構造的表象 / 仮説探索 / アクセント核
研究成果の概要

日本語は語彙レベルの韻律情報(単語アクセント)が,孤立発声時と文音声発声時とでは異なる。複数出力される音声認識仮説の妥当性を再評価するリランキング処理において,予測される(変形後の)語彙レベル韻律と,実際に観測された韻律とを比較することで,精度向上が期待できる。種々の検討の結果,任意テキスト(認識仮説)に対して語彙韻律を予測するモジュール,及び,リランキング処理の実装は完了したが,観測された韻律に対して正しくアクセント核位置を検出する処理系の実装が極めて困難であることがわかった。最終的には準韻律的特徴と解釈できる音声の構造的表象に基づくリランキングを実装し,音声認識精度向上を実現した。

報告書

(4件)
  • 2015 実績報告書   研究成果報告書 ( PDF )
  • 2014 実施状況報告書
  • 2013 実施状況報告書
  • 研究成果

    (10件)

すべて 2015 2014 2013

すべて 雑誌論文 (6件) (うち査読あり 6件、 オープンアクセス 1件) 学会発表 (4件)

  • [雑誌論文] Discriminative re-ranking for automatic recognition by leveraging invariant structures2015

    • 著者名/発表者名
      M. Suzuki, G. Kurata, M. Nishimura, N. Minematsu
    • 雑誌名

      Speech Communication

      巻: 72 ページ: 208-217

    • DOI

      10.1016/j.specom.2015.06.007

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 基本周波数パターン生成過程モデルのモデルパラメータ自動推定とHMM音声合成への適用2015

    • 著者名/発表者名
      橋本浩弥,齋藤大輔,峯松信明,広瀬啓吉
    • 雑誌名

      電子情報通信学会和文論文誌,

      巻: J98-D ページ: 481-491

    • 関連する報告書
      2014 実施状況報告書
    • 査読あり
  • [雑誌論文] Leveraging phonetic context dependent invariant structure for continous speech recognition2014

    • 著者名/発表者名
      C. Zhang, M. Suzuki, G. Kurata, M. Nishimura, N. Minematsu
    • 雑誌名

      oc. IEEE China Summit & International Conference on Signal and Information Processing

      巻: 1 ページ: 52-56

    • DOI

      10.1109/chinasip.2014.6889200

    • 関連する報告書
      2014 実施状況報告書
    • 査読あり
  • [雑誌論文] Semi-supervised noise dictionary adaptation for exemplar-based noise robust speech recognition2014

    • 著者名/発表者名
      Y. Luan, D. Saito, Y. Kashiwagi, N. Minematsu, K. Hirose
    • 雑誌名

      Proc. ICASSP

      巻: 1 ページ: 1764-1767

    • 関連する報告書
      2014 実施状況報告書
    • 査読あり
  • [雑誌論文] Discriminative piecewise linear transformation based on deep learning for noise robust automatic speech recognition2013

    • 著者名/発表者名
      Y. Kashiwagi, D. Saito, N. Minematsu, K. Hirose
    • 雑誌名

      Proc. ASRU

      巻: 1 ページ: 350-355

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [雑誌論文] 条件付き確率場を用いた日本語東京方言のアクセント結合自動推定2013

    • 著者名/発表者名
      鈴木雅之,黒岩龍,印南佳祐,小林俊平,清水信哉,峯松信明,広瀬啓吉
    • 雑誌名

      電子情報通信学会論文誌

      巻: J96-D ページ: 644-654

    • NAID

      110009593032

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [学会発表] 識別的アプローチによる分布間距離推定の検討とその言語識別への応用2015

    • 著者名/発表者名
      柏木陽祐,齋藤大輔,峯松信明,広瀬啓吉
    • 学会等名
      電子情報通信学会音声研究会資料
    • 発表場所
      かたくら諏訪湖ホテル(長野県諏訪市)
    • 年月日
      2015-07-16
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 制約付き話者コードの同時推定によるニューラルネット音響モデルの話者正規化学習2014

    • 著者名/発表者名
      木陽佑,齋藤大輔,峯松信明,広瀬啓吉
    • 学会等名
      日本音響学会
    • 発表場所
      北海学園大学(北海道・札幌)
    • 年月日
      2014-09-03
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] CRFによる日本語東京方言アクセント変化推定の改善2014

    • 著者名/発表者名
      橋本浩弥,峯松信明,広瀬啓吉
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      東京,日本大学
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] Deep Learningに基づくクリーン音声状態識別による雑音環境下音声認識2013

    • 著者名/発表者名
      柏木陽佑,齋藤大輔,峯松信明,広瀬啓吉
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      愛知,豊橋技術科学大学
    • 関連する報告書
      2013 実施状況報告書

URL: 

公開日: 2014-07-25   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi