• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

ウェブドキュメントを利用した音声認識結果の信頼度推定と音声認識の高精度化

Research Project

Project/Area Number 19700184
Research InstitutionFukuoka University

Principal Investigator

高橋 伸弥  Fukuoka University, 工学部, 助教 (40330899)

Keywords音声認識 / 言語モデル / スペクトラルクラスタリング / ニュース音声 / 音声認識信頼度 / 字幕テキスト自動対応付け / Confusion Matrix / ウェブドキュメント
Research Abstract

ニュース音声に対する高精度な自動索引付けを目的として、その内容に類似したウェブドキュメントを自動的に収集し、ニュース音声専用の言語モデルを構築する手法について検討した。ウェブドキュメントを収集するための検索キーワードには、ニュース音声に対する音声認識結果中の名詞句を用いることとし、スペクトラルクラスタリングと呼ばれるクラスタリング手法を用いて誤認識された語句から収集された文書と正認識された語句から収集された文書とを分類することにより、音声認識用言語モデルの精度を向上させることを試みた。小規模なデータに対する実験を行い、本提案手法の基本的なアイデアの有効性を確認し、それらを国際会議他で発表した。
更に、複数のトピックから構成されるニュース音声に対する、同様のアプローチに基づいたトピック切り分け手法を考案し、クラスタリングによりトピック境界を検出することを試みた。具体的には、複数のトピックから得られた誤りを含む検索キーワードを用いてウェブドキュメントを収集し、それらをクラスタリングすることで同一のトピックに関するドキュメントとそれ以外とに分類することでトピック境界を検出しようというものである。小規模なデータに対する実験により、その有効性を確認し改善点を検討し、結果を発表した。
また、上記の提案手法の前処理としての音声区間切り出しおよび音声・非音声識別の高精度化を検討するため、音素認識における混同行列を利用した字幕テキストの自動対応付けを試み、その有効性について検討したものを国内外の学会で発表した。

  • Research Products

    (4 results)

All 2008 2007

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results)

  • [Journal Article] Topic Specific Languag Model Based on Graph Spectral Approach for Speech Recognition2008

    • Author(s)
      S. Takahashi
    • Journal Title

      Trends in Intelligent Systems and Computer Engineering (Lecture Notes Elec. Eng.) 6

      Pages: 497-514

    • Peer Reviewed
  • [Journal Article] Automatic Closed-Caption Alignment Using Pronunciation of Speech Recognition Transcripts for Public Relations TV Program2008

    • Author(s)
      S. Takahashi, T. Morimoto and Y. Nishimoto
    • Journal Title

      Proc. of the Int. Multi-Conference on Engineer and Computer Science 1

      Pages: 259-263

    • Peer Reviewed
  • [Journal Article] News Topic Specific Language Model Based on Spectral Clustering and Web Crawling2007

    • Author(s)
      S. Takahashi, T. Morimoto and N. Tsuruta
    • Journal Title

      IAENG International Journal of Computer Science 34/2

      Pages: 208-213

    • Peer Reviewed
  • [Presentation] Web上の類似文書に対するクラスタリング結果を用いたニュース音声のトピック分割と音声認識結果の信頼度の判定2007

    • Author(s)
      高橋伸弥, 森元逞, 鶴田直之
    • Organizer
      電気関係学会九州支部第60回連合大会
    • Place of Presentation
      琉球大学
    • Year and Date
      2007-09-19

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi