• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

ウェブドキュメントを利用した音声認識結果の信頼度推定と音声認識の高精度化

Research Project

Project/Area Number 19700184
Research InstitutionFukuoka University

Principal Investigator

高橋 伸弥  Fukuoka University, 工学部, 助教 (40330899)

Keywords音声認識 / 言語モデル / スペクトラルクラスタリング / ニュース音声 / 音声認識信頼度 / 言語モデル自動構築 / 動的代替パス探索 / ウェブドキュメント
Research Abstract

ニュース音声に対する高精度な自動索引付けを目的として、その内容に類似したウェブドキュメントを自動的に収集し、ニュース音声専用の言語モデルを構築する手法について検討した。具体的には、前年度までに検討したウェブドキュメントの収集方式および収集された文書をトピックごとにクラスタリングする方式について比較検討を行い、提案手法で用いるスペクトラルクラスタリングの有効性を確認した。またクラスタリングされた収集文書集合の分散から、検索に用いた語句の認識精度を推定することにより、収集文書の信頼性を判断することを検討し、信頼性の高い文書を用いることで認識精度を高めることができることを示した。
またニュース文書を対象として収集された文書の中には3連接以上の熟語や固有名詞を含んだ名詞句が現れるケースが多く見られることから、従来の統計的言語モデルで用いられる3gramモデルをそのまま利用するのではなく、熟語や名詞句をそのままの形で言語モデルに未知語として登録する手法が有効であるとの予想を得ることができた。
上記、提案手法では学習データが小〜中規模になってしまうことから、統計的言語モデルの学習データとしては不十分であると考えられるため、既存の統計的言語モデルと併用するためのネットワーク文法の自動構築手法についても検討した。さらに、ネットワーク文法構築の際の問題点である未知語および未知の文パターンに対する対応策を検討し、その有効性について検討したものを国内外の学会で発表した。

  • Research Products

    (2 results)

All 2009 2008

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (1 results)

  • [Journal Article] Automatic Construction of a FSA Language Model and Speech Recognition on it with Dynamic Alternative Path Search2009

    • Author(s)
      S. Takahashi, T. Morimoto
    • Journal Title

      Proc. of the Int. Multi-Conference on Engineer and Computer Science 1

      Pages: 611-615

    • Peer Reviewed
  • [Presentation] FSA言語モデルの自動構築と動的代替パスサーチによる音声認識2008

    • Author(s)
      高橋伸弥、森元逞
    • Organizer
      情報処理学会音声言語情報処理研究会
    • Place of Presentation
      東京工業大学
    • Year and Date
      2008-10-24

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi