状況認識に基づくスポーツ実況放送音声の認識と構造化

研究課題

研究課題/領域番号	18650039
研究種目	萌芽研究
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	神戸大学
研究代表者	有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)
研究分担者	滝口哲也神戸大学, 都市安全研究センター, 講師 (40397815)
研究期間 (年度)	2006 – 2008
研究課題ステータス	完了 (2008年度)
配分額 *注記	3,200千円 (直接経費: 3,200千円) 2008年度: 700千円 (直接経費: 700千円) 2007年度: 1,300千円 (直接経費: 1,300千円) 2006年度: 1,200千円 (直接経費: 1,200千円)
キーワード	音声認識 / 状況認識 / 音響モデル / 言語モデル / インデックス情報 / 実況放送 / 単語共起 / 感情 / 音声等認識
研究概要	本研課題では、スポーツ実況放送の音声認識、及び状況理解を目的としている。状況理解により、スポーツ実況放送のシーンを構造的な単位に分割し、検索のためのメタ情報として利用可能とする。本研究課題では、確率的な枠組みに基づく音声と状況の同時認識、スポーツの進行に伴う状況変化のモデル化、状況に基づく音声認識モテルに特色がある。状況変化モデルは、発話された音声を認識し、発話内容に基づいてイベント推定、及び状況の遷移を行うモデルとなる。ここでは特に発話内容からのイベント推定が重要となる。本研究では、多様な発話を高精度に分類可能なAdaBoostを推定のためのモデルとして用いた。ただし、AdaBoostの出力は確率ではないことから、スコアをsigmoid関数により擬似確率化して用いた。また、AdaBoostを行う際の特徴量として、単語順序を考慮可能な手法であるDTA-Kernel PCAについても研究を行った。状況に基づく音声認識では、状況に応じて変化する言語的・音響的変化に対し、音声認識のモデルを適応する手法について研究を行った。本研究では、それぞれ状況に対応した複数の言語・音響モデルを構築しておき、認識時にモデルを切り替える手法を用いた。状況依存モデルの尤度、及び発話内容からの状況推定の尤度を統合し、最大化することにより、音声認識と状況推定を同時に行った。スポーツ実況放送では、興奮した音声を含む場合があり、興奮音声の認識は通堂の音響モデルでは困難である。研究課題では、さらなる認識性能向上のため、新しい音声認識特徴量、発話スタイルの変動に頑健な音響モデルについても研究を行った。

報告書

(3件)

研究成果
(65件)

すべて 2009 2008 2007 2006 その他

すべて雑誌論文 (24件) (うち査読あり 10件) 学会発表 (39件) 備考 (2件)

[雑誌論文] 音声・状況の同時認識に某づくスポーツ実況中継へのメタ情報付与2009
- 著者名/発表者名
  佐古淳
- 雑誌名
  
  情報処理学会論文誌 Vol. 50, No. 2
  
  ページ: 536-574
- 関連する報告書
  2008 実績報告書
- 査読あり
[雑誌論文] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008
- 著者名/発表者名
  Takashi Muroi
- 雑誌名
  
  International Journal of Hybrid Information Technology Vol. 1, No. 3
  
  ページ: 61-70
- 関連する報告書
  2008 実績報告書
- 査読あり
[雑誌論文] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008
- 著者名/発表者名
  T. Takiguchi
- 雑誌名
  
  International Journal of Hybrid Information Technology Vol. 1, No. 3
  
  ページ: 81-90
- 関連する報告書
  2008 実績報告書
- 査読あり
[雑誌論文] Language Modeling Using PLSA-Based Topic HMM2008
- 著者名/発表者名
  Atsushi Sako
- 雑誌名
  
  IEICE TRANSACTIONS on Information and Systems Vol.E91-D, No.3
  
  ページ: 522-528
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] PCA-Based Speech Enhancement for Distorted Speech Recognition2007
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  Journal of Multimedia Volume 2, Issue 5
  
  ページ: 13-18
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Estimation of Room Acoustic Transfer Function Using Speech Model2007
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  IEEE Statistical Signal Processing Workshop 2007
  
  ページ: 336-340
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Noise detection and classification in speech signals with boosting2007
- 著者名/発表者名
  Nobuyuki Miyake
- 雑誌名
  
  IEEE Statistical Signal Processing Workshop 2007
  
  ページ: 778-782
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] PCA-Based Feature Extraction for Fluctuation in Speaking Style of Articulation Disorders2007
- 著者名/発表者名
  Hironori Matsumasa
- 雑誌名
  
  Interspeech2007
  
  ページ: 1150-1153
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] System Request Detection in Conversation Based on Acoustic and Speaker Alternation Features2007
- 著者名/発表者名
  Tomoyuki Yamagata
- 雑誌名
  
  Interspeech2007
  
  ページ: 2789-2792
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Estimation of Sound Source Direction Using Parabolic Reflection Board2007
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  NCSP 2008
  
  ページ: 9-12
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] トピックモデルとタスクの知識を用いた言語モデルによる野球実況中継の構造化2007
- 著者名/発表者名
  佐古淳
- 雑誌名
  
  第1回音声ドキュメント処理ワークショップ
  
  ページ: 115-120
- 関連する報告書
  2006 実績報告書
[雑誌論文] ブースティングを用いた野球実況中継に対するメタデータの作成2007
- 著者名/発表者名
  佐古淳
- 雑誌名
  
  第1回音声ドキュメント処理ワークショップ
  
  ページ: 121-126
- 関連する報告書
  2006 実績報告書
[雑誌論文] 構音障害者の音声認識の検討2007
- 著者名/発表者名
  松政宏典
- 雑誌名
  
  日本音響学会2007年春季研究発表会
  
  ページ: 322-324
- 関連する報告書
  2006 実績報告書
[雑誌論文] フィッシャー重みマップに基づく不特定話者音素認識の検討2007
- 著者名/発表者名
  加藤俊祐
- 雑誌名
  
  日本音響学会2007年春季研究発表会
  
  ページ: 127-128
- 関連する報告書
  2006 実績報告書
[雑誌論文] 3次キュムラントのバイスペクトラムとPCAによる音声区間検出2007
- 著者名/発表者名
  松田博義
- 雑誌名
  
  日本音響学会2007年春季研究発表会
  
  ページ: 133-134
- 関連する報告書
  2006 実績報告書
[雑誌論文] AdaBoostを用いた雑音の検出と識別2007
- 著者名/発表者名
  三宅信之
- 雑誌名
  
  日本音響学会2007年春季研究発表会
  
  ページ: 141-142
- 関連する報告書
  2006 実績報告書
[雑誌論文] 2ch マイクロフォン間の振幅補正を考慮した複素スペクトル平面上での雑音除去2007
- 著者名/発表者名
  大久保俊也
- 雑誌名
  
  日本音響学会2007年春季研究発表会
  
  ページ: 717-718
- 関連する報告書
  2006 実績報告書
[雑誌論文] Phoneme Recognition Based on Fisher Weight Map to Higher-Order Local2006
- 著者名/発表者名
  Yasuo Ariki
- 雑誌名
  
  Interspeech 2006
  
  ページ: 377-380
- 関連する報告書
  2006 実績報告書
[雑誌論文] Robust Feature Extraction Using Kernel PCA2006
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  ICASSP2006
  
  ページ: 509-512
- 関連する報告書
  2006 実績報告書
[雑誌論文] 構音障害者の音声認識の検討2006
- 著者名/発表者名
  松政宏典
- 雑誌名
  
  電子情報通信学会技術研究報告 WIT2006-75
  
  ページ: 13-18
- 関連する報告書
  2006 実績報告書
[雑誌論文] 局所特徴量によるフィッシャー重みマップに基づく音素認識2006
- 著者名/発表者名
  加藤俊祐
- 雑誌名
  
  第8回音声言語シンポジウムSLP-64
  
  ページ: 19-24
- 関連する報告書
  2006 実績報告書
[雑誌論文] 3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討2006
- 著者名/発表者名
  松田博義
- 雑誌名
  
  電子情報通信学会技術研究報告 SP-2006-85
  
  ページ: 89-94
- 関連する報告書
  2006 実績報告書
[雑誌論文] 3次キュムラント音声特徴を用いた音声区間検出2006
- 著者名/発表者名
  松田博義
- 雑誌名
  
  電子情報通信学会技術研究報告 SIP-2006
  
  ページ: 37-42
- 関連する報告書
  2006 実績報告書
[雑誌論文] Real Adaboostによる音声区間検出2006
- 著者名/発表者名
  松田博義
- 雑誌名
  
  日本音響会2006年秋季研究発表会
  
  ページ: 117-118
- 関連する報告書
  2006 実績報告書
[学会発表] 音声・状況の同時認識に基づく野球実況中継へのメタ情報付与2009
- 著者名/発表者名
  佐古淳
- 学会等名
  第3回者声ドキュメント処理ワークショップ
- 発表場所
  豊橋
- 関連する報告書
  2008 実績報告書
[学会発表] 雑談中の潜在的話題遷移を考慮したユーザーの意図推定の検討2009
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 関連する報告書
  2008 実績報告書
[学会発表] 複数の言語情報を用いたCRFによる音声認識誤りの検出2009
- 著者名/発表者名
  松本智彦
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 関連する報告書
  2008 実績報告書
[学会発表] ランダムプロジェクシヨンを用いた音声特徴量抽出2009
- 著者名/発表者名
  吉井麻里子
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 関連する報告書
  2008 実績報告書
[学会発表] FBANKとGaborWaveletを用いたシステムへの問い合わせと雑談の判別2008
- 著者名/発表者名
  山形知行
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] パラボラ反射板を用いたアクティブマイクロフォンによる音源方向推定2008
- 著者名/発表者名
  高島遼一
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] 単一マイクロホンを用いた音響伝達特性の尤度判定による音源位置推定2008
- 著者名/発表者名
  住田雄司
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] SVMとCARTの組み合わせによるAdaBoostを用いた音声区間検出2008
- 著者名/発表者名
  松田博義
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] 音声特徴量抽出のための音素部分空間統合法の検討2008
- 著者名/発表者名
  朴玄信
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] 話者正規化に基づく構音障害者の音声認識2008
- 著者名/発表者名
  松政宏典
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] LSAに基づくOne-Class SVMを用いた音声認識仮説の検証2008
- 著者名/発表者名
  松本智彦
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] 動的計画法に基づく文脈の変化を考慮したLSAの検討2008
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] Sudden Noise Reduction Based on GMM with Noise Power Estimation2008
- 著者名/発表者名
  Nobuyuki Miyake
- 学会等名
  Interspeech 2008
- 発表場所
  オーストラリア
- 関連する報告書
  2008 実績報告書
[学会発表] Integration of Phoneme-subspaces using ICA for Speech Feature Extraction and Recognition2008
- 著者名/発表者名
  Hyunsin Park
- 学会等名
  HSCMA2008
- 発表場所
  イタリア
- 関連する報告書
  2008 実績報告書
[学会発表] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008
- 著者名/発表者名
  Takashi Muroi
- 学会等名
  The 2nd International Conference on Multimediaand Ubiquitous Engineering (MUE2008)
- 発表場所
  韓国
- 関連する報告書
  2008 実績報告書
[学会発表] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008
- 著者名/発表者名
  Tetsuya Takiguchi
- 学会等名
  The 2nd International Conference on Multimediaand Ubiquitous Engineering (MUE2008)
- 発表場所
  韓国
- 関連する報告書
  2008 実績報告書
[学会発表] 単語出現順序を考慮したトピックモデルによる言語モデル適応2008
- 著者名/発表者名
  佐古淳
- 学会等名
  第10回音声言語シンポジウム
- 発表場所
  早稲田
- 関連する報告書
  2008 実績報告書
[学会発表] 制約付き非負行列因子分解を用いた音声特徴抽出の検討2008
- 著者名/発表者名
  朴玄信
- 学会等名
  第10回音声言語シンポジウム
- 発表場所
  早稲田
- 関連する報告書
  2008 実績報告書
[学会発表] スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討2008
- 著者名/発表者名
  室井貴司
- 学会等名
  第10回音声言語シンポジウム
- 発表場所
  早稲田
- 関連する報告書
  2008 実績報告書
[学会発表] 音声の動的特徴のモデルを使った突発性雑音の除去2008
- 著者名/発表者名
  三宅信之
- 学会等名
  第10回が声よ語シンポジウム
- 発表場所
  早稲田
- 関連する報告書
  2008 実績報告書
[学会発表] MDL基準とICAを用いた統合音素部分空間による音声特徴量抽出の検討2008
- 著者名/発表者名
  朴玄信
- 学会等名
  日本音絆学会2008年秋季研究発表会
- 発表場所
  福岡
- 関連する報告書
  2008 実績報告書
[学会発表] DP-Kernel PCA を用いた発話系列への意図ラペリングの検討2008
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2008年秋季研究発表会
- 発表場所
  福岡
- 関連する報告書
  2008 実績報告書
[学会発表] GMMに基づく音声特徴量の時間変動を考慮した突発性雑音の除去2008
- 著者名/発表者名
  三宅信之
- 学会等名
  日本音響学会2008年秋季研究発衣会
- 発表場所
  福岡
- 関連する報告書
  2008 実績報告書
[学会発表] 勾配に基づく特徴量を用いた音声認識の検討2008
- 著者名/発表者名
  室井貴司
- 学会等名
  日本音響学会2008年秋季研究発表会
- 発表場所
  福岡
- 関連する報告書
  2008 実績報告書
[学会発表] 韻律及び話者交代情報を用いたシステム要求検出2007
- 著者名/発表者名
  山形知行
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-21
- 関連する報告書
  2007 実績報告書
[学会発表] 音素部分空間の統合による音声特徴量抽出の検討2007
- 著者名/発表者名
  朴玄信
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-21
- 関連する報告書
  2007 実績報告書
[学会発表] 弱識別器にSVMを用いたAdaBoostの検討2007
- 著者名/発表者名
  松田博義
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-20
- 関連する報告書
  2007 実績報告書
[学会発表] 音声認識との統合によるシステム要求検出2007
- 著者名/発表者名
  佐古淳
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-20
- 関連する報告書
  2007 実績報告書
[学会発表] 音声GMMと雑音重み推定を用いた雑音除去2007
- 著者名/発表者名
  三宅信之
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-20
- 関連する報告書
  2007 実績報告書
[学会発表] 話者交替を考慮したシステムへの問い合わせと雑談の判別2007
- 著者名/発表者名
  山形知行
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出2007
- 著者名/発表者名
  松田博義
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] フィッシャー重みマップに基づく音声特徴量のロバストネスに関する考察2007
- 著者名/発表者名
  室井貴司
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] PCAを用いた音素ベクトルによる音声特徴量抽出の検討2007
- 著者名/発表者名
  朴玄信
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] 雑音重み推定と音声GMMを用いた既知雑音除去2007
- 著者名/発表者名
  三宅信之
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] 単一マイクロホンを用いた音響伝達特性の判別による音源方向推定の検討2007
- 著者名/発表者名
  住田雄司
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] 脳性麻痺構音障害者の音声認識による情報家電操作の検討2007
- 著者名/発表者名
  松政宏典
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] ワードグラフを考慮したシステム要求検出2007
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-20
- 関連する報告書
  2007 実績報告書
[学会発表] 音素PCAを用いた残響下における音声特徴量抽出2007
- 著者名/発表者名
  朴玄信
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  京阪奈(京都)
- 年月日
  2007-05-31
- 関連する報告書
  2007 実績報告書
[学会発表] 情報家電操作における脳性麻痺構音障害者の音声認識評価2007
- 著者名/発表者名
  松政宏典
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  沖縄
- 年月日
  2007-05-24
- 関連する報告書
  2007 実績報告書
[備考]
- URL
  http://www.me.cs.scitec.kobe-u.ac.jp/publications/publications.html
- 関連する報告書
  2008 実績報告書
[備考]
- URL
  http://www.me.cs.scitec.kobe-u.ac.jp/publications/publications.html
- 関連する報告書
  2007 実績報告書

状況認識に基づくスポーツ実況放送音声の認識と構造化

研究代表者

有木 康雄 神戸大学, 都市安全研究センター, 教授 (10135519)

3,200千円 (直接経費: 3,200千円)

報告書

研究成果

[雑誌論文] 音声・状況の同時認識に某づくスポーツ実況中継へのメタ情報付与2009

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Language Modeling Using PLSA-Based Topic HMM2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] PCA-Based Speech Enhancement for Distorted Speech Recognition2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Estimation of Room Acoustic Transfer Function Using Speech Model2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Noise detection and classification in speech signals with boosting2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] PCA-Based Feature Extraction for Fluctuation in Speaking Style of Articulation Disorders2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] System Request Detection in Conversation Based on Acoustic and Speaker Alternation Features2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Estimation of Sound Source Direction Using Parabolic Reflection Board2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] トピックモデルとタスクの知識を用いた言語モデルによる野球実況中継の構造化2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] ブースティングを用いた野球実況中継に対するメタデータの作成2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 構音障害者の音声認識の検討2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] フィッシャー重みマップに基づく不特定話者音素認識の検討2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 3次キュムラントのバイスペクトラムとPCAによる音声区間検出2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] AdaBoostを用いた雑音の検出と識別2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 2ch マイクロフォン間の振幅補正を考慮した複素スペクトル平面上での雑音除去2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Phoneme Recognition Based on Fisher Weight Map to Higher-Order Local2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Robust Feature Extraction Using Kernel PCA2006

著者名/発表者名

有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)