2007 年度実績報告書

状況認識に基づくスポーツ実況放送音声の認識と構造化

研究課題

研究課題/領域番号	18650039
研究機関	神戸大学
研究代表者	有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)
研究分担者	滝口哲也神戸大学, 都市安全研究センター, 講師 (40397815)
キーワード	音声認識 / 状況認識 / 音響モデル / 言語モデル / インデックス情報 / 実況放送 / 単語共起 / 感情
研究概要	本研究課題では、スポーツ実況放送音声を認識し、インデックス情報の付与、及びシーンの構造分割の実現を目的としている。スポーツの進行に伴う状況の変化をモデル化し、音声認識に組み入れることで認識性能の向上を実現する。状況の変化をモデル化する手法として、Probabilistic Latent Semantic Analysis(pLSA)とHMMにより発話のトピックの遷移を表現する手法を提案した。これは、各発話のトピックベクトルをpLSAによって求め、そのトピックの変化をHMMによって表現したモデルである。これにより、固定された言語モデルによって音声認識を行うのではなく、発話ごとに適した言語モデルを構築して音声認識を行うことが可能となった。本手法においては、明確なトピックを定義するのではなく、pLSAとHMMにより、教師なしで自動的に状況変化モデルを構築している。そのため、スポーツ実況中継に限らず、幅広い範囲での応用が可能と考えられる。また、発話の意図認識について研究を行った。これは、発話が音声認識システムへの問い合わせか、その他、人同士の雑談・独り言などとの識別を目的としている。直接、スポーツをテーマにしたものではないが、スポーツのゲーム進行を説明する発話、解説者との雑談などを区別する目的において応用可能な研究である。これは、言語的な特徴、韻律特徴、それぞれを用いた場合について研究を行った。更に、より認識性能を向上させるため、新しい特徴量の検討、多様な音声を認識するために発話スタイルの変動に頑健な特徴を用いた音響モデル、音声に含まれる突発性雑音の分類と除去についても研究を行った。

研究成果
(31件)

すべて 2008 2007 その他

すべて雑誌論文 (7件) (うち査読あり 7件) 学会発表 (23件) 備考 (1件)

[雑誌論文] Language Modeling Using PLSA-Based Topic HMM2008
- 著者名/発表者名
  Atsushi Sako
- 雑誌名
  
  IEICE TRANSACTIONS on Information and Systems Vol.E91-D, No.3
  
  ページ: 522-528
- 査読あり
[雑誌論文] PCA-Based Speech Enhancement for Distorted Speech Recognition2007
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  Journal of Multimedia Volume 2, Issue 5
  
  ページ: 13-18
- 査読あり
[雑誌論文] Estimation of Room Acoustic Transfer Function Using Speech Model2007
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  IEEE Statistical Signal Processing Workshop 2007
  
  ページ: 336-340
- 査読あり
[雑誌論文] Noise detection and classification in speech signals with boosting2007
- 著者名/発表者名
  Nobuyuki Miyake
- 雑誌名
  
  IEEE Statistical Signal Processing Workshop 2007
  
  ページ: 778-782
- 査読あり
[雑誌論文] PCA-Based Feature Extraction for Fluctuation in Speaking Style of Articulation Disorders2007
- 著者名/発表者名
  Hironori Matsumasa
- 雑誌名
  
  Interspeech2007
  
  ページ: 1150-1153
- 査読あり
[雑誌論文] System Request Detection in Conversation Based on Acoustic and Speaker Alternation Features2007
- 著者名/発表者名
  Tomoyuki Yamagata
- 雑誌名
  
  Interspeech2007
  
  ページ: 2789-2792
- 査読あり
[雑誌論文] Estimation of Sound Source Direction Using Parabolic Reflection Board2007
- 著者名/発表者名
  Tetsuya Takiguchi
- 雑誌名
  
  NCSP 2008
  
  ページ: 9-12
- 査読あり
[学会発表] FBANKとGaborWaveletを用いたシステムへの問い合わせと雑談の判別2008
- 著者名/発表者名
  山形知行
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] パラボラ反射板を用いたアクティブマイクロフォンによる音源方向推定2008
- 著者名/発表者名
  高島遼一
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] 単一マイクロホンを用いた音響伝達特性の尤度判定による音源位置推定2008
- 著者名/発表者名
  住田雄司
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] SVMとCARTの組み合わせによるAdaBoostを用いた音声区間検出2008
- 著者名/発表者名
  松田博義
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] 音声特徴量抽出のための音素部分空間統合法の検討2008
- 著者名/発表者名
  朴玄信
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] 話者正規化に基づく構音障害者の音声認識2008
- 著者名/発表者名
  松政宏典
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] LSAに基づくOne-Class SVMを用いた音声認識仮説の検証2008
- 著者名/発表者名
  松本智彦
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] 動的計画法に基づく文脈の変化を考慮したLSAの検討2008
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2008年春季研究発表会
- 発表場所
  千葉
- 年月日
  2008-03-17
[学会発表] 韻律及び話者交代情報を用いたシステム要求検出2007
- 著者名/発表者名
  山形知行
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-21
[学会発表] 音素部分空間の統合による音声特徴量抽出の検討2007
- 著者名/発表者名
  朴玄信
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-21
[学会発表] 弱識別器にSVMを用いたAdaBoostの検討2007
- 著者名/発表者名
  松田博義
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-20
[学会発表] 音声認識との統合によるシステム要求検出2007
- 著者名/発表者名
  佐古淳
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-20
[学会発表] 音声GMMと雑音重み推定を用いた雑音除去2007
- 著者名/発表者名
  三宅信之
- 学会等名
  第9回音声言語シンポジウム
- 発表場所
  京阪奈(京都)
- 年月日
  2007-12-20
[学会発表] 話者交替を考慮したシステムへの問い合わせと雑談の判別2007
- 著者名/発表者名
  山形知行
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出2007
- 著者名/発表者名
  松田博義
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] フィッシャー重みマップに基づく音声特徴量のロバストネスに関する考察2007
- 著者名/発表者名
  室井貴司
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] PCAを用いた音素ベクトルによる音声特徴量抽出の検討2007
- 著者名/発表者名
  朴玄信
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] 雑音重み推定と音声GMMを用いた既知雑音除去2007
- 著者名/発表者名
  三宅信之
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] 単一マイクロホンを用いた音響伝達特性の判別による音源方向推定の検討2007
- 著者名/発表者名
  住田雄司
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] 脳性麻痺構音障害者の音声認識による情報家電操作の検討2007
- 著者名/発表者名
  松政宏典
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-21
[学会発表] ワードグラフを考慮したシステム要求検出2007
- 著者名/発表者名
  佐古淳
- 学会等名
  日本音響学会2007年秋季研究発表会
- 発表場所
  甲府(山梨)
- 年月日
  2007-09-20
[学会発表] 音素PCAを用いた残響下における音声特徴量抽出2007
- 著者名/発表者名
  朴玄信
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  京阪奈(京都)
- 年月日
  2007-05-31
[学会発表] 情報家電操作における脳性麻痺構音障害者の音声認識評価2007
- 著者名/発表者名
  松政宏典
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  沖縄
- 年月日
  2007-05-24
[備考]
- URL
  http://www.me.cs.scitec.kobe-u.ac.jp/publications/publications.html

2007 年度 実績報告書

状況認識に基づくスポーツ実況放送音声の認識と構造化

研究代表者

有木 康雄 神戸大学, 都市安全研究センター, 教授 (10135519)

研究成果

[雑誌論文] Language Modeling Using PLSA-Based Topic HMM2008

著者名/発表者名

雑誌名

[雑誌論文] PCA-Based Speech Enhancement for Distorted Speech Recognition2007

著者名/発表者名

雑誌名

[雑誌論文] Estimation of Room Acoustic Transfer Function Using Speech Model2007

著者名/発表者名

雑誌名

[雑誌論文] Noise detection and classification in speech signals with boosting2007

著者名/発表者名

雑誌名

[雑誌論文] PCA-Based Feature Extraction for Fluctuation in Speaking Style of Articulation Disorders2007

著者名/発表者名

雑誌名

[雑誌論文] System Request Detection in Conversation Based on Acoustic and Speaker Alternation Features2007

著者名/発表者名

雑誌名

[雑誌論文] Estimation of Sound Source Direction Using Parabolic Reflection Board2007

著者名/発表者名

雑誌名

[学会発表] FBANKとGaborWaveletを用いたシステムへの問い合わせと雑談の判別2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] パラボラ反射板を用いたアクティブマイクロフォンによる音源方向推定2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 単一マイクロホンを用いた音響伝達特性の尤度判定による音源位置推定2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] SVMとCARTの組み合わせによるAdaBoostを用いた音声区間検出2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声特徴量抽出のための音素部分空間統合法の検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 話者正規化に基づく構音障害者の音声認識2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] LSAに基づくOne-Class SVMを用いた音声認識仮説の検証2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 動的計画法に基づく文脈の変化を考慮したLSAの検討2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 韻律及び話者交代情報を用いたシステム要求検出2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音素部分空間の統合による音声特徴量抽出の検討2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 弱識別器にSVMを用いたAdaBoostの検討2007

著者名/発表者名

学会等名

発表場所

2007 年度実績報告書

有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)