• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

自然な発話による音声インタラクションのための言語モデルに関する研究

Research Project

Project/Area Number 11J07766
Research InstitutionToyohashi University of Technology

Principal Investigator

太田 健吾  豊橋技術科学大学, 大学院・工学研究科, 特別研究員(DC2)

Keywords音声認識 / 言語モデル / 音響モデル / 話し言葉
Research Abstract

本年度は,話し言葉特有の言い回しを考慮した音声認識用言語モデルを構築する方法について検討してきた.話し言葉を対象とした音声認識用言語モデルを構築するためには,対象音声とドメインが一致し,かつ,話し言葉特有の言い回しが忠実に書き起こされた大規模な話し言葉コーパス(テキストデータベース)から言語モデルを学習するという方法が一般的である.しかし,話し言葉を正確に書き起こす作業は極めて高いコストを必要とするため,あらゆるドメインに対して,そのようなコーパスが入手できると仮定することは現実的ではない.それに対して,速記録や会議録は,正確な書き起こしより広く作成されており,比較的容易に入手が可能である.ただし,速記録や会議録では,可読性を高めるために,間投詞や言い淀み,言い直しなどの話し言葉特有の現象は削除され,話し言葉特有の言い回しは適切な書き言葉に置き換えられるなど,様々な整形処理がなされていることが一般的である.
このような背景を踏まえて,本研究では,速記録や会議録(整形された書き起こし)を正確な書き起こしに半自動的に変換する枠組みの構築について検討してきた.この枠組みでは,まず整形された書き起こし中の整形箇所を自動検出し,検出された整形箇所のみを人手で書き起こすことにより,できるだけ小さいコストで,整形された書き起こしと正確な書き起こしのパラレルコーパスを作成する.
本研究で提案した整形箇所の自動検出手法を,国会会議録を用いた評価実験によって評価した結果,実用的な検出精度を達成することができた.さらに,提案法を用いて検出された非整形箇所は,音声認識用音響モデルの話者適応用データとして有効であることを示した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

整形された書き起こしと正確な書き起こしのパラレルコーパスを効率的に構築するために,整形された書き起こしから整形箇所を自動検出する方法を提案し,実際の国会会議録を用いた評価実験において実用的な検出精度が達成できた.さらに,本提案手法は,音声認識用音響モデルの話者適応にも応用できることを示した.よって,おおむね順調に進展しているといえる.

Strategy for Future Research Activity

今後は,まず,これまでに提案した手法に基づいて,整形された書き起こしと正確な書き起こしの大規模なパラレルコーパスを集積する.次に,このパラレルコーパスに基づいて,大規模な書き言葉コーパスから話し言葉特有の言い回しを考慮した音声認識用言語モデルを構築し,この言語モデルを,音声認識実験によって評価する.

  • Research Products

    (3 results)

All 2012 2011

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results)

  • [Journal Article] ポーズを考慮した話し言葉言語モデルの構築2012

    • Author(s)
      太田健吾, 土屋雅稔, 中川聖一
    • Journal Title

      情報処理学会論文誌

      Volume: Vol.53,No.2 Pages: 889-900

    • Peer Reviewed
  • [Presentation] 整形された書き起こしからの整形・非整形部分の自動検出2012

    • Author(s)
      太田健吾
    • Organizer
      第6回音声ドキュメント処理ワークショップ
    • Place of Presentation
      豊橋技術科学大学(愛知県)
    • Year and Date
      2012-03-03
  • [Presentation] Detection of Precisely Transcribed Parts from Inexact Transcribed Corpus2011

    • Author(s)
      太田健吾
    • Organizer
      IEEE workshop on Automatic Speech Recognition and Understanding (ASRU)
    • Place of Presentation
      Hawaii, USA
    • Year and Date
      20111211-20111215

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi