• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

研究課題

研究課題/領域番号 17700208
研究機関早稲田大学

研究代表者

小川 哲司  早稲田大学, 理工学術院, 助手 (70386598)

キーワードパターン認識 / 音声情報処理 / 自然発話音声認識 / 音響モデル / モデル構造最適化
研究概要

本年度は,以下の2点について検討を行った.
(1)部分隠れマルコフモデル(PHMM)のモデル構造最適選択
PHMMのモデル構造を音韻毎に最適化する枠組みとして,昨年度は,評価基準として重み付き尤度比最大化基準を,最適化アルゴリズムとして遺伝的アルゴリズムを導入し,講演音声認識において従来法の誤りを削減した.本年度は,下記A)〜C)について詳細な検討を行った.
A)評価関数:重み付き尤度比基準,最尤基準,ベイズ基準など複数の評価基準を導入し認識性能を評価したところ,識別的な基準である尤度比基準が最良の性能を与えることがわかった.
B)最適化アルゴリズム:遺伝的アルゴリズムとタブサーチを用いたときの性能を評価したところ,タブサーチは局所解に陥りやすく,遺伝的アルゴリズムの方が高速に最適解に到達することがわかった.
C)識別クラスの共有:探索の効率化のため音韻のクラスタリングを行ったが,最適化の段階でクラスを共有してしまうと,共有しない場合と同程度の性能を得られないことがわかった.
(2)環境の変動に頑健な特徴量の検討
PHMMのように高精度な確率モデルは,HMMなどの単純なモデルと比較して発話者や環境の変動の影響を受け易い.したがって,音響特徴量から発話者の情報や環境の情報を取り除き,識別に必要な情報である音韻情報のみを抽出する手法(識別情報抽出)について検討を行った.識別情報抽出として,HLDAやそれを拡張したManifold HLDA(MHLDA)を提案し,単語音声認識により評価を行ったところ,HLDAとMHLDAにより抽出されたパラメータを統合することで,環境の変動に対して頑健な性能を与えることがわかった.
この知見を発展させ,HLDAにブースティングを導入した確率モデルの統合手法についても検討を行い,最尤識別に比べ頑健性の高い認識が可能になるという予備的な知見も得た.

  • 研究成果

    (4件)

すべて 2007 2006

すべて 雑誌論文 (4件)

  • [雑誌論文] 重み付きHLDAを用いた相補的識別器の構成2007

    • 著者名/発表者名
      加藤健一, 小川哲司, 小林哲則
    • 雑誌名

      日本音響学会春季研究発表会講演論文集

      ページ: 39-40

  • [雑誌論文] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006

    • 著者名/発表者名
      Tetsuji Ogawa, Tetsunori Kobayashi
    • 雑誌名

      IEICE Trans. on Information and Systems vol.E89-D,no.3

      ページ: 939-945

  • [雑誌論文] Manifold HLDA and Its Application to Robust Speech Recognition2006

    • 著者名/発表者名
      Toshiaki Kubo, Tetsuji Ogawa, Tetsunori Kobayashi
    • 雑誌名

      Proc. Interspeech2006

      ページ: 1551-1554

  • [雑誌論文] 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合2006

    • 著者名/発表者名
      加藤健一, 小川哲司, 小林哲則
    • 雑誌名

      情報処理学会研究報告 2006-SLP-64(35)

      ページ: 203-208

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi