• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

語彙レベル韻律情報の高精度予測に基づく大語彙連続音声認識の高精度化

研究課題

研究課題/領域番号 25540064
研究機関東京大学

研究代表者

峯松 信明  東京大学, 工学(系)研究科(研究院), 教授 (90273333)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード音声認識 / 韻律的特徴 / 仮説探索 / リランキング / アクセント核
研究実績の概要

大語彙連続音声認識の高精度化を実現する方法として,リランキング処理がある。これは,音声認識結果を複数仮説として出力し,それを再評価する(リランキングする)ことで,高精度化を図るものである。音声認識処理においては利用が困難である特徴量や情報を用いて,後処理としてリランキングすることが多い。本研究では,この処理の中に,韻律的妥当性,より具体的には,アクセント的妥当性(仮説より想定されるアクセント核位置と,実際の音声信号から推定されるアクセント核位置の整合性)を導入することを目的としていた。しかしながら,連続音声からのアクセント核位置推定を十分な精度で実現することができず,上記そのものの実装は諦めざるをえなかった。その一方で,韻律的特徴と解釈できる分節的特徴(音色に基づく音声のメロディー,"Holistic and prosodic representation of the segmental aspect of speech," Speech Prosody 2008, "Speech as timbre-based melody -- What in parants' voices do infants imitate acoustically? --," Int. Conf. Language, Music, and the Mind)である,音声の構造的表象を用いたリランキングについても一連の検討を継続していた。こちらの方法論については一定の成果を出すことができ,DNN 音声認識をベースラインとした場合でも精度向上を確認できた。その成果は,top journal の一つである speech communication 誌にて発表することができた。

  • 研究成果

    (2件)

すべて 2015

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (1件)

  • [雑誌論文] Discriminative re-ranking for automatic recognition by leveraging invariant structures2015

    • 著者名/発表者名
      M. Suzuki, G. Kurata, M. Nishimura, N. Minematsu
    • 雑誌名

      Speech Communication

      巻: 72 ページ: 208, 217

    • DOI

      doi:10.1016/j.specom.2015.06.007

    • 査読あり / オープンアクセス
  • [学会発表] 識別的アプローチによる分布間距離推定の検討とその言語識別への応用2015

    • 著者名/発表者名
      柏木陽祐,齋藤大輔,峯松信明,広瀬啓吉
    • 学会等名
      電子情報通信学会音声研究会資料
    • 発表場所
      かたくら諏訪湖ホテル(長野県諏訪市)
    • 年月日
      2015-07-16 – 2015-07-16

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi