2005 年度実績報告書

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

研究課題

研究課題/領域番号	17700208
研究機関	早稲田大学
研究代表者	小川哲司早稲田大学, 理工学術院, 助手 (70386598)
キーワード	パターン認識 / 音声情報処理 / 自然発話音声認識 / 音響モデル / モデル構造最適化
研究概要	本年度は,下記の2点について検討を行った. 1)PHMMの自然発話音声認識への適用複雑な特徴量の時間変化を音響モデルによって扱うことを目的としてPHMMを提案し,新聞読み上げ音声認識においてその有効性を確認してきた.このとき,PHMMにおける状態と出力間の相互依存構造を全ての音韻クラスで共通とする枠組みを採用し,構造最適化に対する予備的な知見を得てきた.本年度は,この枠組みを自然発話音声認識のタスクの一つである,講演音声認識に適用し評価を行うことにより,構造最適化に対する性能のベースラインを調べた.この結果,PHMMは,読み上げ音声認識のみならず講演音声認識においても,一般的な音響モデルであるHMMに対し良好な性能を与えることがわかった. 2)PHMMにおけるモデル構造の最適化に関する検討 PHMMは出力確率と遷移確率双方に前出力依存性を有した確率モデルであるが,これまでの枠組みでは,構造は全ての音韻クラスで共通なものを用いてきた.そこで本年度は,重みつき尤度比最大化基準に基づき,PHMMにおける状態と出力間の依存構造を,音韻クラス毎に最適に選択することを試みた.重みつき尤度比最大化基準は識別的な評価尺度であるため,この基準によって推定されたモデル構造は,結果として正解クラスと不正解クラスに対して高い識別能力を有する.ここでは,全てのカテゴリに対して取り得るモデル構造の組み合わせの中から,最大の重みつき尤度比を与える構造の組み合わせを最適なモデル構造と定義し探索の最適な近似として遺伝的アルゴリズムを適用した.学会講演音声を対象とした連続音声認識実験によって,提案するモデル構造選択手法の有効性を評価したところ,HMMや,構造を全てのカテゴリで共通としたPHMMの誤りを削減することがわかった.

研究成果
(9件)

すべて 2006 2005

すべて雑誌論文 (9件)

[雑誌論文] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006
- 著者名/発表者名
  Tetsuji Ogawa, Tetsunori Kobayashi
- 雑誌名
  
  IEICE Trans.on Information and Systems Vol.E89-D, No.3
[雑誌論文] Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion2005
- 著者名/発表者名
  Tetsuji Ogawa, Tetsunori Kobayashi
- 雑誌名
  
  Proc.of Interspeech
  
  ページ: 3353-3356
[雑誌論文] A Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation Usign Reference Signal2005
- 著者名/発表者名
  Takashi Isa, Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi
- 雑誌名
  
  Proc.of Biennial on Digital Signal Processing For In-Veicle and Mobile Systems
  
  ページ: 15
[雑誌論文] 識別的基準と遺伝的アルゴリズムに基づく隠れ部分マルコフモデルの構造の最適化2005
- 著者名/発表者名
  小川哲司, 小林哲則
- 雑誌名
  
  電子情報通信学会技術研究報告 SP2005-26
  
  ページ: 37-42
[雑誌論文] ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位2005
- 著者名/発表者名
  久保俊明, 持木南生也, 小川哲司, 小林哲則
- 雑誌名
  
  人工知能学会研究会資料 SIG-Challenge-0522
  
  ページ: 89-94
[雑誌論文] 参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上2005
- 著者名/発表者名
  伊佐崇, 関矢俊之, 小川哲司, 小林哲則
- 雑誌名
  
  電子情報通信学会技術研究報告 SP2005-32
  
  ページ: 31-36
[雑誌論文] マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果2005
- 著者名/発表者名
  久保俊明, 持木南生也, 小川哲司, 小林哲則
- 雑誌名
  
  電子情報通信学会技術研究報告 ST2005-33
  
  ページ: 37-42
[雑誌論文] BSSとスペクトルサブトラクションの多段処理による音源分離2005
- 著者名/発表者名
  伊佐崇, 関矢俊之, 小川哲司, 小林哲則
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集
  
  ページ: 705-706
[雑誌論文] ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果2005
- 著者名/発表者名
  久保俊明, 持木南生也, 小川哲司, 小林哲則
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集
  
  ページ: 717-718

2005 年度 実績報告書

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

研究代表者

小川 哲司 早稲田大学, 理工学術院, 助手 (70386598)

研究成果

[雑誌論文] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006

著者名/発表者名

雑誌名

[雑誌論文] Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion2005

著者名/発表者名

雑誌名

[雑誌論文] A Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation Usign Reference Signal2005

著者名/発表者名

雑誌名

[雑誌論文] 識別的基準と遺伝的アルゴリズムに基づく隠れ部分マルコフモデルの構造の最適化2005

著者名/発表者名

雑誌名

[雑誌論文] ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位2005

著者名/発表者名

雑誌名

[雑誌論文] 参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上2005

著者名/発表者名

雑誌名

[雑誌論文] マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果2005

著者名/発表者名

雑誌名

[雑誌論文] BSSとスペクトルサブトラクションの多段処理による音源分離2005

著者名/発表者名

雑誌名

[雑誌論文] ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果2005

著者名/発表者名

雑誌名

2005 年度実績報告書

小川哲司早稲田大学, 理工学術院, 助手 (70386598)