• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

音声認識技術を用いたe-ラーニング教材コンテンツ作成補助システムに関する研究

Research Project

Project/Area Number 17700597
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Educational technology
Research InstitutionTohoku University

Principal Investigator

大河 雄一  東北大学, 大学院・教育情報学研究部, 助手 (60361177)

Project Period (FY) 2005 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2006: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2005: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywordse-ラーニング / 音声認識 / 教育工学
Research Abstract

平成18年度は,本研究課題の最終年度に当たる。本年度においては,本研究の目的である授業・講義等の発話内容を用いたeラーニング教材作成システムに用いるための音声認識モデルおよび音声認識手法の検討を行った。従来より,本研究が対象とするような大学での講義などの音声は,非常に変化が激しい自然発話音声の一つであるため認識が困難であることが,他の研究などから指摘されていた。そこで本研究では前年度に得られていた知見などをもとに自然発話音声の音声認識精度の向上を図った。
本年度検討した講義音声認識の手法は,音声に含まれる音素の持続時間が通常の長さとは極端に異なるものを認識誤りの可能性が高いものと見なし,これを抑制するものである。このために,発話様式の似た学術講演を対象とした大規模な音声コーパスCSJを用いて,事前に持続時間の知識を獲得し,認識対象の音声を音素持続時間の観点でスコア化し,認識結果の候補のリスコアリングにより持続時間の誤りを抑制した。この方法により,従来,持続時間の知識を用いる時,検討されていなかった発話速度や文内の位置などの言語的特徴の影響をモデルに取り込み高精度に持続時間の予測を可能とした。
本提案法により,最大で4.7%の音素認識誤り削減率が得られた。これは,従来法により持続時間を考慮した場合に2.1%の改善しか得られないのと比べ,有意な改善であった。また,この成果は情報処理学会論文誌に投稿し,採録された。

Report

(2 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • Research Products

    (1 results)

All 2006

All Journal Article (1 results)

  • [Journal Article] 発話速度と言語的特徴を考慮した音素持続時間モデルを用いた音声認識2006

    • Author(s)
      大河 雄一
    • Journal Title

      情報処理学会論文誌 47巻・12号

      Pages: 3380-3391

    • Related Report
      2006 Annual Research Report

URL: 

Published: 2005-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi