2008 年度実績報告書

状況認識に基づくスポーツ実況放送音声の認識と構造化

研究課題

研究課題/領域番号	18650039
研究機関	神戸大学
研究代表者	有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)
研究分担者	滝口哲也神戸大学, 都市安全研究センター, 講師 (40397815)
キーワード	音声認識 / 状況認識 / 音響モデル / 言語モデル / インデックス情報 / 実況放送 / 単語共起 / 感情
研究概要	本研課題では、スポーツ実況放送の音声認識、及び状況理解を目的としている。状況理解により、スポーツ実況放送のシーンを構造的な単位に分割し、検索のためのメタ情報として利用可能とする。本研究課題では、確率的な枠組みに基づく音声と状況の同時認識、スポーツの進行に伴う状況変化のモデル化、状況に基づく音声認識モテルに特色がある。状況変化モデルは、発話された音声を認識し、発話内容に基づいてイベント推定、及び状況の遷移を行うモデルとなる。ここでは特に発話内容からのイベント推定が重要となる。本研究では、多様な発話を高精度に分類可能なAdaBoostを推定のためのモデルとして用いた。ただし、AdaBoostの出力は確率ではないことから、スコアをsigmoid関数により擬似確率化して用いた。また、AdaBoostを行う際の特徴量として、単語順序を考慮可能な手法であるDTA-Kernel PCAについても研究を行った。状況に基づく音声認識では、状況に応じて変化する言語的・音響的変化に対し、音声認識のモデルを適応する手法について研究を行った。本研究では、それぞれ状況に対応した複数の言語・音響モデルを構築しておき、認識時にモデルを切り替える手法を用いた。状況依存モデルの尤度、及び発話内容からの状況推定の尤度を統合し、最大化することにより、音声認識と状況推定を同時に行った。スポーツ実況放送では、興奮した音声を含む場合があり、興奮音声の認識は通堂の音響モデルでは困難である。研究課題では、さらなる認識性能向上のため、新しい音声認識特徴量、発話スタイルの変動に頑健な音響モデルについても研究を行った。

研究成果
(20件)

すべて 2009 2008 その他

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (16件) 備考 (1件)

[雑誌論文] 音声・状況の同時認識に某づくスポーツ実況中継へのメタ情報付与2009
- 著者名/発表者名
  佐古淳
- 雑誌名
  
  情報処理学会論文誌 Vol. 50, No. 2
  
  ページ: 536-574
- 査読あり
[雑誌論文] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008
- 著者名/発表者名
  Takashi Muroi
- 雑誌名
  
  International Journal of Hybrid Information Technology Vol. 1, No. 3
  
  ページ: 61-70
- 査読あり
[雑誌論文] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008
- 著者名/発表者名
  T. Takiguchi
- 雑誌名
  
  International Journal of Hybrid Information Technology Vol. 1, No. 3
  
  ページ: 81-90
- 査読あり
[学会発表] 雑談中の潜在的話題遷移を考慮したユーザーの意図推定の検討2009
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 年月日
  20090317-20090319
[学会発表] 複数の言語情報を用いたCRFによる音声認識誤りの検出2009
- 著者名/発表者名
  松本智彦
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 年月日
  20090317-20090319
[学会発表] ランダムプロジェクシヨンを用いた音声特徴量抽出2009
- 著者名/発表者名
  吉井麻里子
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 年月日
  20090317-20090319
[学会発表] 音声・状況の同時認識に基づく野球実況中継へのメタ情報付与2009
- 著者名/発表者名
  佐古淳
- 学会等名
  第3回者声ドキュメント処理ワークショップ
- 発表場所
  豊橋
- 年月日
  20090227-20090228
[学会発表] 単語出現順序を考慮したトピックモデルによる言語モデル適応2008
- 著者名/発表者名
  佐古淳
- 学会等名
  第10回音声言語シンポジウム
- 発表場所
  早稲田
- 年月日
  20081209-20081210
[学会発表] 制約付き非負行列因子分解を用いた音声特徴抽出の検討2008
- 著者名/発表者名
  朴玄信
- 学会等名
  第10回音声言語シンポジウム
- 発表場所
  早稲田
- 年月日
  20081209-20081210
[学会発表] スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討2008
- 著者名/発表者名
  室井貴司
- 学会等名
  第10回音声言語シンポジウム
- 発表場所
  早稲田
- 年月日
  20081209-20081210
[学会発表] 音声の動的特徴のモデルを使った突発性雑音の除去2008
- 著者名/発表者名
  三宅信之
- 学会等名
  第10回が声よ語シンポジウム
- 発表場所
  早稲田
- 年月日
  20081209-20081210
[学会発表] Sudden Noise Reduction Based on GMM with Noise Power Estimation2008
- 著者名/発表者名
  Nobuyuki Miyake
- 学会等名
  Interspeech 2008
- 発表場所
  オーストラリア
- 年月日
  20080922-20080926
[学会発表] MDL基準とICAを用いた統合音素部分空間による音声特徴量抽出の検討2008
- 著者名/発表者名
  朴玄信
- 学会等名
  日本音絆学会2008年秋季研究発表会
- 発表場所
  福岡
- 年月日
  20080910-20080912
[学会発表] DP-Kernel PCA を用いた発話系列への意図ラペリングの検討2008
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2008年秋季研究発表会
- 発表場所
  福岡
- 年月日
  20080910-20080912
[学会発表] GMMに基づく音声特徴量の時間変動を考慮した突発性雑音の除去2008
- 著者名/発表者名
  三宅信之
- 学会等名
  日本音響学会2008年秋季研究発衣会
- 発表場所
  福岡
- 年月日
  20080910-20080912
[学会発表] 勾配に基づく特徴量を用いた音声認識の検討2008
- 著者名/発表者名
  室井貴司
- 学会等名
  日本音響学会2008年秋季研究発表会
- 発表場所
  福岡
- 年月日
  20080910-20080912
[学会発表] Integration of Phoneme-subspaces using ICA for Speech Feature Extraction and Recognition2008
- 著者名/発表者名
  Hyunsin Park
- 学会等名
  HSCMA2008
- 発表場所
  イタリア
- 年月日
  20080506-20080508
[学会発表] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008
- 著者名/発表者名
  Takashi Muroi
- 学会等名
  The 2nd International Conference on Multimediaand Ubiquitous Engineering (MUE2008)
- 発表場所
  韓国
- 年月日
  20080424-20080426
[学会発表] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008
- 著者名/発表者名
  Tetsuya Takiguchi
- 学会等名
  The 2nd International Conference on Multimediaand Ubiquitous Engineering (MUE2008)
- 発表場所
  韓国
- 年月日
  20080424-20080426
[備考]
- URL
  http://www.me.cs.scitec.kobe-u.ac.jp/publications/publications.html

2008 年度 実績報告書

状況認識に基づくスポーツ実況放送音声の認識と構造化

研究代表者

有木 康雄 神戸大学, 都市安全研究センター, 教授 (10135519)

研究成果

[雑誌論文] 音声・状況の同時認識に某づくスポーツ実況中継へのメタ情報付与2009

著者名/発表者名

雑誌名

[雑誌論文] Speaker Independent Phoneme Recognition Based on Fisher Weight Map2008

著者名/発表者名

雑誌名

[雑誌論文] Human-Robot Interface Using System Request Utterance Detection Based on Acoustic Features2008

著者名/発表者名

雑誌名

[学会発表] 雑談中の潜在的話題遷移を考慮したユーザーの意図推定の検討2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 複数の言語情報を用いたCRFによる音声認識誤りの検出2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] ランダムプロジェクシヨンを用いた音声特徴量抽出2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声・状況の同時認識に基づく野球実況中継へのメタ情報付与2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 単語出現順序を考慮したトピックモデルによる言語モデル適応2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 制約付き非負行列因子分解を用いた音声特徴抽出の検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声の動的特徴のモデルを使った突発性雑音の除去2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Sudden Noise Reduction Based on GMM with Noise Power Estimation2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] MDL基準とICAを用いた統合音素部分空間による音声特徴量抽出の検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] DP-Kernel PCA を用いた発話系列への意図ラペリングの検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] GMMに基づく音声特徴量の時間変動を考慮した突発性雑音の除去2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 勾配に基づく特徴量を用いた音声認識の検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Integration of Phoneme-subspaces using ICA for Speech Feature Extraction and Recognition2008

2008 年度実績報告書

有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)