• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

状況認識に基づくスポーツ実況放送音声の認識と構造化

研究課題

研究課題/領域番号 18650039
研究機関神戸大学

研究代表者

有木 康雄  神戸大学, 都市安全研究センター, 教授 (10135519)

研究分担者 滝口 哲也  神戸大学, 都市安全研究センター, 講師 (40397815)
キーワード音声等認識 / 状況認識 / 音響モデル / 言語モデル / インデックス情報 / 実況放送 / 単語共起 / 感情
研究概要

スポーツ実況放送音声を音声認識し、インデックス情報の付与、及びシーンの構造分割を実現するために、スポーツの進行に伴う状況の推定を、音声認識の枠内に組み込む手法の研究を行った。
まず、状況の変化に伴って変化する言語モデルについて研究を行った。状況として、(1)野球のルールに従うカウント情報等、(2)実況放送の書き起こしテキストにおける話題をそれぞれ用いた場合について、言語モデルを提案した。(1)を用いた場合、ルール上の矛盾を引き起こすような認識誤りを防ぐことが可能となった。(2)では、話題の遷移が不自然となるような認識誤りや、同一話題中に現れては不自然な単語の認識誤りが低減された。2つを組み合わせて用いることにより両方の効果を得ることができた。
次に、状況の変化を推定するモデルについて研究を行った。推定手法として、(1)「投げ」と「ストライク」、「三振」などとの共起による手法、(2)一発話全体の単語を用いた投票による手法、(3)書き起こしテキストにおける話題遷移確率を用いる手法の提案を行った。特に(2)では、87%の精度で状況を正しく推定することができた。
また、発話の感情的な変化に頑健な音響モデルを構築するために、(1)状況に応じて音響モデルを切り替える手法、(2)発話スタイルの変動成分を主成分分析により分離する手法、(3)発話の局所的な変化を利用する手法について研究を行った。感情の変化にモデルを追従させることにより頑健に認識を行う手法と、感情の変化がある場合でも言語的には変化しない特徴を用いることで頑健に認識を行う手法の両面について研究を行った。
一方、高精度な音声認識のために、正しい発話区間の推定や雑音の除去も、重要な基礎技術である。そのため、これらについても研究を行った。

  • 研究成果

    (14件)

すべて 2007 2006

すべて 雑誌論文 (14件)

  • [雑誌論文] トピックモデルとタスクの知識を用いた言語モデルによる野球実況中継の構造化2007

    • 著者名/発表者名
      佐古淳
    • 雑誌名

      第1回音声ドキュメント処理ワークショップ

      ページ: 115-120

  • [雑誌論文] ブースティングを用いた野球実況中継に対するメタデータの作成2007

    • 著者名/発表者名
      佐古淳
    • 雑誌名

      第1回音声ドキュメント処理ワークショップ

      ページ: 121-126

  • [雑誌論文] 構音障害者の音声認識の検討2007

    • 著者名/発表者名
      松政宏典
    • 雑誌名

      日本音響学会2007年春季研究発表会

      ページ: 322-324

  • [雑誌論文] フィッシャー重みマップに基づく不特定話者音素認識の検討2007

    • 著者名/発表者名
      加藤俊祐
    • 雑誌名

      日本音響学会2007年春季研究発表会

      ページ: 127-128

  • [雑誌論文] 3次キュムラントのバイスペクトラムとPCAによる音声区間検出2007

    • 著者名/発表者名
      松田博義
    • 雑誌名

      日本音響学会2007年春季研究発表会

      ページ: 133-134

  • [雑誌論文] AdaBoostを用いた雑音の検出と識別2007

    • 著者名/発表者名
      三宅信之
    • 雑誌名

      日本音響学会2007年春季研究発表会

      ページ: 141-142

  • [雑誌論文] 2ch マイクロフォン間の振幅補正を考慮した複素スペクトル平面上での雑音除去2007

    • 著者名/発表者名
      大久保俊也
    • 雑誌名

      日本音響学会2007年春季研究発表会

      ページ: 717-718

  • [雑誌論文] Phoneme Recognition Based on Fisher Weight Map to Higher-Order Local2006

    • 著者名/発表者名
      Yasuo Ariki
    • 雑誌名

      Interspeech 2006

      ページ: 377-380

  • [雑誌論文] Robust Feature Extraction Using Kernel PCA2006

    • 著者名/発表者名
      Tetsuya Takiguchi
    • 雑誌名

      ICASSP2006

      ページ: 509-512

  • [雑誌論文] 構音障害者の音声認識の検討2006

    • 著者名/発表者名
      松政宏典
    • 雑誌名

      電子情報通信学会技術研究報告 WIT2006-75

      ページ: 13-18

  • [雑誌論文] 局所特徴量によるフィッシャー重みマップに基づく音素認識2006

    • 著者名/発表者名
      加藤俊祐
    • 雑誌名

      第8回音声言語シンポジウムSLP-64

      ページ: 19-24

  • [雑誌論文] 3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討2006

    • 著者名/発表者名
      松田博義
    • 雑誌名

      電子情報通信学会技術研究報告 SP-2006-85

      ページ: 89-94

  • [雑誌論文] 3次キュムラント音声特徴を用いた音声区間検出2006

    • 著者名/発表者名
      松田博義
    • 雑誌名

      電子情報通信学会技術研究報告 SIP-2006

      ページ: 37-42

  • [雑誌論文] Real Adaboostによる音声区間検出2006

    • 著者名/発表者名
      松田博義
    • 雑誌名

      日本音響会2006年秋季研究発表会

      ページ: 117-118

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi