• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

状況認識に基づくスポーツ実況放送音声の認識と構造化

Research Project

Project/Area Number 18650039
Research InstitutionKobe University

Principal Investigator

有木 康雄  Kobe University, 都市安全研究センター, 教授 (10135519)

Co-Investigator(Kenkyū-buntansha) 滝口 哲也  神戸大学, 都市安全研究センター, 講師 (40397815)
Keywords音声認識 / 状況認識 / 音響モデル / 言語モデル / インデックス情報 / 実況放送 / 単語共起 / 感情
Research Abstract

本研究課題では、スポーツ実況放送音声を認識し、インデックス情報の付与、及びシーンの構造分割の実現を目的としている。スポーツの進行に伴う状況の変化をモデル化し、音声認識に組み入れることで認識性能の向上を実現する。
状況の変化をモデル化する手法として、Probabilistic Latent Semantic Analysis(pLSA)とHMMにより発話のトピックの遷移を表現する手法を提案した。これは、各発話のトピックベクトルをpLSAによって求め、そのトピックの変化をHMMによって表現したモデルである。これにより、固定された言語モデルによって音声認識を行うのではなく、発話ごとに適した言語モデルを構築して音声認識を行うことが可能となった。本手法においては、明確なトピックを定義するのではなく、pLSAとHMMにより、教師なしで自動的に状況変化モデルを構築している。そのため、スポーツ実況中継に限らず、幅広い範囲での応用が可能と考えられる。
また、発話の意図認識について研究を行った。これは、発話が音声認識システムへの問い合わせか、その他、人同士の雑談・独り言などとの識別を目的としている。直接、スポーツをテーマにしたものではないが、スポーツのゲーム進行を説明する発話、解説者との雑談などを区別する目的において応用可能な研究である。これは、言語的な特徴、韻律特徴、それぞれを用いた場合について研究を行った。
更に、より認識性能を向上させるため、新しい特徴量の検討、多様な音声を認識するために発話スタイルの変動に頑健な特徴を用いた音響モデル、音声に含まれる突発性雑音の分類と除去についても研究を行った。

  • Research Products

    (31 results)

All 2008 2007 Other

All Journal Article (7 results) (of which Peer Reviewed: 7 results) Presentation (23 results) Remarks (1 results)

  • [Journal Article] Language Modeling Using PLSA-Based Topic HMM2008

    • Author(s)
      Atsushi Sako
    • Journal Title

      IEICE TRANSACTIONS on Information and Systems Vol.E91-D, No.3

      Pages: 522-528

    • Peer Reviewed
  • [Journal Article] PCA-Based Speech Enhancement for Distorted Speech Recognition2007

    • Author(s)
      Tetsuya Takiguchi
    • Journal Title

      Journal of Multimedia Volume 2, Issue 5

      Pages: 13-18

    • Peer Reviewed
  • [Journal Article] Estimation of Room Acoustic Transfer Function Using Speech Model2007

    • Author(s)
      Tetsuya Takiguchi
    • Journal Title

      IEEE Statistical Signal Processing Workshop 2007

      Pages: 336-340

    • Peer Reviewed
  • [Journal Article] Noise detection and classification in speech signals with boosting2007

    • Author(s)
      Nobuyuki Miyake
    • Journal Title

      IEEE Statistical Signal Processing Workshop 2007

      Pages: 778-782

    • Peer Reviewed
  • [Journal Article] PCA-Based Feature Extraction for Fluctuation in Speaking Style of Articulation Disorders2007

    • Author(s)
      Hironori Matsumasa
    • Journal Title

      Interspeech2007

      Pages: 1150-1153

    • Peer Reviewed
  • [Journal Article] System Request Detection in Conversation Based on Acoustic and Speaker Alternation Features2007

    • Author(s)
      Tomoyuki Yamagata
    • Journal Title

      Interspeech2007

      Pages: 2789-2792

    • Peer Reviewed
  • [Journal Article] Estimation of Sound Source Direction Using Parabolic Reflection Board2007

    • Author(s)
      Tetsuya Takiguchi
    • Journal Title

      NCSP 2008

      Pages: 9-12

    • Peer Reviewed
  • [Presentation] FBANKとGaborWaveletを用いたシステムへの問い合わせと雑談の判別2008

    • Author(s)
      山形知行
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] パラボラ反射板を用いたアクティブマイクロフォンによる音源方向推定2008

    • Author(s)
      高島遼一
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] 単一マイクロホンを用いた音響伝達特性の尤度判定による音源位置推定2008

    • Author(s)
      住田雄司
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] SVMとCARTの組み合わせによるAdaBoostを用いた音声区間検出2008

    • Author(s)
      松田博義
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] 音声特徴量抽出のための音素部分空間統合法の検討2008

    • Author(s)
      朴玄信
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] 話者正規化に基づく構音障害者の音声認識2008

    • Author(s)
      松政宏典
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] LSAに基づくOne-Class SVMを用いた音声認識仮説の検証2008

    • Author(s)
      松本智彦
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] 動的計画法に基づく文脈の変化を考慮したLSAの検討2008

    • Author(s)
      佐古淳
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-17
  • [Presentation] 韻律及び話者交代情報を用いたシステム要求検出2007

    • Author(s)
      山形知行
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      京阪奈(京都)
    • Year and Date
      2007-12-21
  • [Presentation] 音素部分空間の統合による音声特徴量抽出の検討2007

    • Author(s)
      朴 玄信
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      京阪奈(京都)
    • Year and Date
      2007-12-21
  • [Presentation] 弱識別器にSVMを用いたAdaBoostの検討2007

    • Author(s)
      松田博義
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      京阪奈(京都)
    • Year and Date
      2007-12-20
  • [Presentation] 音声認識との統合によるシステム要求検出2007

    • Author(s)
      佐古淳
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      京阪奈(京都)
    • Year and Date
      2007-12-20
  • [Presentation] 音声GMMと雑音重み推定を用いた雑音除去2007

    • Author(s)
      三宅信之
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      京阪奈(京都)
    • Year and Date
      2007-12-20
  • [Presentation] 話者交替を考慮したシステムへの問い合わせと雑談の判別2007

    • Author(s)
      山形知行
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出2007

    • Author(s)
      松田博義
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] フィッシャー重みマップに基づく音声特徴量のロバストネスに関する考察2007

    • Author(s)
      室井貴司
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] PCAを用いた音素ベクトルによる音声特徴量抽出の検討2007

    • Author(s)
      朴玄信
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] 雑音重み推定と音声GMMを用いた既知雑音除去2007

    • Author(s)
      三宅信之
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] 単一マイクロホンを用いた音響伝達特性の判別による音源方向推定の検討2007

    • Author(s)
      住田雄司
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] 脳性麻痺構音障害者の音声認識による情報家電操作の検討2007

    • Author(s)
      松政宏典
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-21
  • [Presentation] ワードグラフを考慮したシステム要求検出2007

    • Author(s)
      佐古淳
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      甲府(山梨)
    • Year and Date
      2007-09-20
  • [Presentation] 音素PCAを用いた残響下における音声特徴量抽出2007

    • Author(s)
      朴玄信
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      京阪奈(京都)
    • Year and Date
      2007-05-31
  • [Presentation] 情報家電操作における脳性麻痺構音障害者の音声認識評価2007

    • Author(s)
      松政宏典
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      沖縄
    • Year and Date
      2007-05-24
  • [Remarks]

    • URL

      http://www.me.cs.scitec.kobe-u.ac.jp/publications/publications.html

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi