• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

状況認識に基づくスポーツ実況放送音声の認識と構造化

Research Project

Project/Area Number 18650039
Research InstitutionKobe University

Principal Investigator

有木 康雄  Kobe University, 都市安全研究センター, 教授 (10135519)

Co-Investigator(Kenkyū-buntansha) 滝口 哲也  神戸大学, 都市安全研究センター, 講師 (40397815)
Keywords音声認識 / 状況認識 / 音響モデル / 言語モデル / インデックス情報 / 実況放送 / 単語共起 / 感情
Research Abstract

本研課題では、スポーツ実況放送の音声認識、及び状況理解を目的としている。状況理解により、スポーツ実況放送のシーンを構造的な単位に分割し、検索のためのメタ情報として利用可能とする。本研究課題では、確率的な枠組みに基づく音声と状況の同時認識、スポーツの進行に伴う状況変化のモデル化、状況に基づく音声認識モテルに特色がある。
状況変化モデルは、発話された音声を認識し、発話内容に基づいてイベント推定、及び状況の遷移を行うモデルとなる。ここでは特に発話内容からのイベント推定が重要となる。本研究では、多様な発話を高精度に分類可能なAdaBoostを推定のためのモデルとして用いた。ただし、AdaBoostの出力は確率ではないことから、スコアをsigmoid関数により擬似確率化して用いた。また、AdaBoostを行う際の特徴量として、単語順序を考慮可能な手法であるDTA-Kernel PCAについても研究を行った。
状況に基づく音声認識では、状況に応じて変化する言語的・音響的変化に対し、音声認識のモデルを適応する手法について研究を行った。本研究では、それぞれ状況に対応した複数の言語・音響モデルを構築しておき、認識時にモデルを切り替える手法を用いた。状況依存モデルの尤度、及び発話内容からの状況推定の尤度を統合し、最大化することにより、音声認識と状況推定を同時に行った。
スポーツ実況放送では、興奮した音声を含む場合があり、興奮音声の認識は通堂の音響モデルでは困難である。研究課題では、さらなる認識性能向上のため、新しい音声認識特徴量、発話スタイルの変動に頑健な音響モデルについても研究を行った。

  • Research Products

    (20 results)

All 2009 2008 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (16 results) Remarks (1 results)

  • [Journal Article] 音声・状況の同時認識に某づくスポーツ実況中継へのメタ情報付与2009

    • Author(s)
      佐古淳
    • Journal Title

      情報処理学会論文誌 Vol. 50, No. 2

      Pages: 536-574

    • Peer Reviewed
  • [Journal Article] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008

    • Author(s)
      Takashi Muroi
    • Journal Title

      International Journal of Hybrid Information Technology Vol. 1, No. 3

      Pages: 61-70

    • Peer Reviewed
  • [Journal Article] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008

    • Author(s)
      T. Takiguchi
    • Journal Title

      International Journal of Hybrid Information Technology Vol. 1, No. 3

      Pages: 81-90

    • Peer Reviewed
  • [Presentation] 雑談中の潜在的話題遷移を考慮したユーザーの意図推定の検討2009

    • Author(s)
      佐古淳
    • Organizer
      日本音響学会2009年春季研究発表会
    • Place of Presentation
      東京
    • Year and Date
      20090317-20090319
  • [Presentation] 複数の言語情報を用いたCRFによる音声認識誤りの検出2009

    • Author(s)
      松本智彦
    • Organizer
      日本音響学会2009年春季研究発表会
    • Place of Presentation
      東京
    • Year and Date
      20090317-20090319
  • [Presentation] ランダムプロジェクシヨンを用いた音声特徴量抽出2009

    • Author(s)
      吉井麻里子
    • Organizer
      日本音響学会2009年春季研究発表会
    • Place of Presentation
      東京
    • Year and Date
      20090317-20090319
  • [Presentation] 音声・状況の同時認識に基づく野球実況中継へのメタ情報付与2009

    • Author(s)
      佐古淳
    • Organizer
      第3回者声ドキュメント処理ワークショップ
    • Place of Presentation
      豊橋
    • Year and Date
      20090227-20090228
  • [Presentation] 単語出現順序を考慮したトピックモデルによる言語モデル適応2008

    • Author(s)
      佐古淳
    • Organizer
      第10回音声言語シンポジウム
    • Place of Presentation
      早稲田
    • Year and Date
      20081209-20081210
  • [Presentation] 制約付き非負行列因子分解を用いた音声特徴抽出の検討2008

    • Author(s)
      朴玄信
    • Organizer
      第10回音声言語シンポジウム
    • Place of Presentation
      早稲田
    • Year and Date
      20081209-20081210
  • [Presentation] スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討2008

    • Author(s)
      室井貴司
    • Organizer
      第10回音声言語シンポジウム
    • Place of Presentation
      早稲田
    • Year and Date
      20081209-20081210
  • [Presentation] 音声の動的特徴のモデルを使った突発性雑音の除去2008

    • Author(s)
      三宅信之
    • Organizer
      第10回が声よ語シンポジウム
    • Place of Presentation
      早稲田
    • Year and Date
      20081209-20081210
  • [Presentation] Sudden Noise Reduction Based on GMM with Noise Power Estimation2008

    • Author(s)
      Nobuyuki Miyake
    • Organizer
      Interspeech 2008
    • Place of Presentation
      オーストラリア
    • Year and Date
      20080922-20080926
  • [Presentation] MDL基準とICAを用いた統合音素部分空間による音声特徴量抽出の検討2008

    • Author(s)
      朴玄信
    • Organizer
      日本音絆学会2008年秋季研究発表会
    • Place of Presentation
      福岡
    • Year and Date
      20080910-20080912
  • [Presentation] DP-Kernel PCA を用いた発話系列への意図ラペリングの検討2008

    • Author(s)
      佐古淳
    • Organizer
      日本音響学会2008年秋季研究発表会
    • Place of Presentation
      福岡
    • Year and Date
      20080910-20080912
  • [Presentation] GMMに基づく音声特徴量の時間変動を考慮した突発性雑音の除去2008

    • Author(s)
      三宅信之
    • Organizer
      日本音響学会2008年秋季研究発衣会
    • Place of Presentation
      福岡
    • Year and Date
      20080910-20080912
  • [Presentation] 勾配に基づく特徴量を用いた音声認識の検討2008

    • Author(s)
      室井貴司
    • Organizer
      日本音響学会2008年秋季研究発表会
    • Place of Presentation
      福岡
    • Year and Date
      20080910-20080912
  • [Presentation] Integration of Phoneme-subspaces using ICA for Speech Feature Extraction and Recognition2008

    • Author(s)
      Hyunsin Park
    • Organizer
      HSCMA2008
    • Place of Presentation
      イタリア
    • Year and Date
      20080506-20080508
  • [Presentation] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008

    • Author(s)
      Takashi Muroi
    • Organizer
      The 2nd International Conference on Multimediaand Ubiquitous Engineering (MUE2008)
    • Place of Presentation
      韓国
    • Year and Date
      20080424-20080426
  • [Presentation] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008

    • Author(s)
      Tetsuya Takiguchi
    • Organizer
      The 2nd International Conference on Multimediaand Ubiquitous Engineering (MUE2008)
    • Place of Presentation
      韓国
    • Year and Date
      20080424-20080426
  • [Remarks]

    • URL

      http://www.me.cs.scitec.kobe-u.ac.jp/publications/publications.html

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi