• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

講演・講義・討論のディジタルアーカイブ化のための音声・映像の認識と理解

Research Project

Project/Area Number 16200011
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)

Co-Investigator(Kenkyū-buntansha) 美濃 導彦  京都大学, 学術情報メディアセンター, 教授 (70166099)
古井 貞煕  東京工業大学, 情報理工学研究科, 教授 (90293076)
秋田 祐哉  京都大学, 学術情報メディアセンター, 助手 (90402742)
Keywords音声情報処理 / 音声認識 / 音声アーカイブ / 話し言葉処理 / 自動タグ付与 / 講演 / 講義 / 討論
Research Abstract

講義や討論を主な対象として,音声言語処理に基づいて高次のディジタルアーカイブを構成する方法について研究した.
まず,講義を対象として,使用されるスライド資料を活用して,対応する音声区間を分割するとともに,その話題に対して音声認識用の言語モデルを適応する方法を研究した.具体的には,当該講義のスライド全体のテキストを用いて,PLSA(Probabilistic Latent Semantic Analysis)によりN-gramモデルのスケーリングを行うとともに,発話に対応する個々のスライドの情報を用いて,キャッシュモデルによりスライドに現れる単語の確率を強化する.この結果,音声認識精度,特にキーワードの検出精度で大きな改善が見られ,大学の講義でも80%に近い精度を実現した.
また,スライド資料がない会議音声を話題単位に自動分割する手法を研究した.音声認識結果に対して,PLSAを適用して,話題を表す特徴ベクトルに変換し,その類似度に基づいて話題分割を行う.さらに,話題ごとに類似したテキストを収集して,単語辞書の更新とN-gram言語モデルの適応を行う.これらの手法を,衆議院予算委員会の音声で評価を行った.これらの処理に基づいて,講義や討論に字幕を付与する試みを行った.

  • Research Products

    (7 results)

All 2007 2006

All Journal Article (6 results) Book (1 results)

  • [Journal Article] Out-of-domain utterance detection using classification confidences of multiple topics2007

    • Author(s)
      I.R.Lane, T.Kawahara, T.Matsui, S.Nakamura
    • Journal Title

      IEEE Trans. Audio, Speech & Language Processing Vol. 15, No. 1

      Pages: 150-161

  • [Journal Article] Intelligent transcription system based on spontaneous speech processing2007

    • Author(s)
      T.Kawahara
    • Journal Title

      Proc. Int'l Conference on Informatics Research for Development of Knowledge Society Infrastructure

      Pages: 19-26

  • [Journal Article] 複数特徴の重み付き統合による雑音に頑健な発話区間検出2006

    • Author(s)
      木田祐介, 河原達也
    • Journal Title

      電子情報通信学会論文誌 Vol. J89-DII, No. 8

      Pages: 1820-1828

  • [Journal Article] Dialogue strategy to clarify user's queries for document retrieval system with speech interface2006

    • Author(s)
      T.Misu, T.Kawahara
    • Journal Title

      Speech Communication Vol. 48, No. 9

      Pages: 1137-1150

  • [Journal Article] Efficient estimation of language model statistics of spontaneous speech via statistical transformation model2006

    • Author(s)
      Y.Akita, T.Kawahara
    • Journal Title

      Proc. IEEE-ICASSP 1

      Pages: 1049-1052

  • [Journal Article] Detection of quotations and inserted clauses and its application to dependency structure analysis in2006

    • Author(s)
      R.Hamabe, K.Uchimoto, T.Kawahara, H.Isahara
    • Journal Title

      Proc. COLING-ACL

      Pages: 324-330

  • [Book] 音声対話システム2006

    • Author(s)
      河原達也, 荒木雅弘
    • Total Pages
      208
    • Publisher
      オーム社
    • Description
      「研究成果報告書概要(和文)」より

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi