• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

自然な発話による音声インタラクションのための言語モデルに関する研究

Research Project

Project/Area Number 11J07766
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section国内
Research Field Intelligent informatics
Research InstitutionToyohashi University of Technology

Principal Investigator

太田 健吾  豊橋技術科学大学, 大学院・工学研究科, 特別研究員(DC2)

Project Period (FY) 2011 – 2012
Project Status Completed (Fiscal Year 2012)
Budget Amount *help
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2012: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2011: ¥700,000 (Direct Cost: ¥700,000)
Keywords音声認識 / 言語モデル / 音響モデル / 話し言葉
Research Abstract

大規模な話し言葉のコーパス(音声言語データベース)は,様々な音声言語処理タスクにおいて重要である.しかし,話し言葉を正確に書き起こす作業は極めて高いコストを必要とするため,あらゆるドメインに対して,そのようなコーパスが入手できると仮定することは現実的ではない.それに対して,速記録や会議録は,正確な書き起こしより広く作成されており,比較的容易に入手が可能である.ただし,速記録や会議録では,可読性を高めるために,間投詞や言い淀み,言い直しなどの話し言葉特有の現象は削除され,話し言葉特有の言い回しは適切な書き言葉に置き換えられるなど,様々な整形処理がなされていることが一般的である.従って、このようなコーパスを,音声認識用音響モデルの学習に直接的に用いることは困難であった.
そこで,本年度は,著者らが従来提案してきた速記録や会議録(整形された書き起こし)から正確に書き起こされた箇所を自動検出する手法を改良した.提案手法では,まず,整形された書き起こしとその原音声とでアラインメントを行い,アラインメントによって得られた素性に基づくSupport Vector Machine(SVM)を用いて,正確に書き起こされた箇所を自動検出する.従来手法とは異なり,音節を単位とする音響的素性を用いることで,検出精度を改善することができた.また,国会会議録を対象とした評価実験により,提案手法を用いて検出された正確な書き起こしは,音声認識用音響モデルの話者適応用データとして有効であることを示した.

Report

(2 results)
  • 2012 Annual Research Report
  • 2011 Annual Research Report
  • Research Products

    (5 results)

All 2012 2011

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results)

  • [Journal Article] ポーズを考慮した話し言葉言語モデルの構築2012

    • Author(s)
      太田健吾, 土屋雅稔, 中川聖一
    • Journal Title

      情報処理学会論文誌

      Volume: Vol.53,No.2 Pages: 889-900

    • NAID

      110008767197

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Presentation] 整形された書き起こしからの整形・非整形部分の自動検出2012

    • Author(s)
      太田健吾
    • Organizer
      第6回音声ドキュメント処理ワークショップ
    • Place of Presentation
      豊橋技術科学大学(愛知県)
    • Year and Date
      2012-03-03
    • Related Report
      2011 Annual Research Report
  • [Presentation] Developing Partially-Transcribed Speech Corpus from Edited Transcriptions2012

    • Author(s)
      太田健吾
    • Organizer
      The eighth international conference on Language Resources and Evaluation(LREC)
    • Place of Presentation
      Istanbul, Turkey
    • Related Report
      2012 Annual Research Report
  • [Presentation] Development of large vocabulary continuous speech recognition system for Mongolian language2012

    • Author(s)
      中川聖一
    • Organizer
      The third International Workshop on Spoken Languages Technologies for Under-resourced Languages (SLTU'12)
    • Place of Presentation
      Cape Town, South Africa
    • Related Report
      2012 Annual Research Report
  • [Presentation] Detection of Precisely Transcribed Parts from Inexact Transcribed Corpus2011

    • Author(s)
      太田健吾
    • Organizer
      IEEE workshop on Automatic Speech Recognition and Understanding (ASRU)
    • Place of Presentation
      Hawaii, USA
    • Related Report
      2011 Annual Research Report

URL: 

Published: 2011-12-12   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi