• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

自然な発話による音声インタラクションのための言語モデルに関する研究

Research Project

Project/Area Number 11J07766
Research InstitutionToyohashi University of Technology

Principal Investigator

太田 健吾  豊橋技術科学大学, 大学院・工学研究科, 特別研究員(DC2)

Keywords音声認識 / 言語モデル / 音響モデル / 話し言葉
Research Abstract

大規模な話し言葉のコーパス(音声言語データベース)は,様々な音声言語処理タスクにおいて重要である.しかし,話し言葉を正確に書き起こす作業は極めて高いコストを必要とするため,あらゆるドメインに対して,そのようなコーパスが入手できると仮定することは現実的ではない.それに対して,速記録や会議録は,正確な書き起こしより広く作成されており,比較的容易に入手が可能である.ただし,速記録や会議録では,可読性を高めるために,間投詞や言い淀み,言い直しなどの話し言葉特有の現象は削除され,話し言葉特有の言い回しは適切な書き言葉に置き換えられるなど,様々な整形処理がなされていることが一般的である.従って、このようなコーパスを,音声認識用音響モデルの学習に直接的に用いることは困難であった.
そこで,本年度は,著者らが従来提案してきた速記録や会議録(整形された書き起こし)から正確に書き起こされた箇所を自動検出する手法を改良した.提案手法では,まず,整形された書き起こしとその原音声とでアラインメントを行い,アラインメントによって得られた素性に基づくSupport Vector Machine(SVM)を用いて,正確に書き起こされた箇所を自動検出する.従来手法とは異なり,音節を単位とする音響的素性を用いることで,検出精度を改善することができた.また,国会会議録を対象とした評価実験により,提案手法を用いて検出された正確な書き起こしは,音声認識用音響モデルの話者適応用データとして有効であることを示した.

  • Research Products

    (2 results)

All 2012

All Presentation (2 results)

  • [Presentation] Developing Partially-Transcribed Speech Corpus from Edited Transcriptions2012

    • Author(s)
      太田健吾
    • Organizer
      The eighth international conference on Language Resources and Evaluation(LREC)
    • Place of Presentation
      Istanbul, Turkey
    • Year and Date
      20120523-20120525
  • [Presentation] Development of large vocabulary continuous speech recognition system for Mongolian language2012

    • Author(s)
      中川聖一
    • Organizer
      The third International Workshop on Spoken Languages Technologies for Under-resourced Languages (SLTU'12)
    • Place of Presentation
      Cape Town, South Africa
    • Year and Date
      20120507-20120509

URL: 

Published: 2014-07-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi