• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

相補的な識別器の生成とその統合に基づくパターン認識に関する研究

研究課題

研究課題/領域番号 19700181
研究機関早稲田大学

研究代表者

小川 哲司  早稲田大学, 高等研究所, 助教 (70386598)

キーワードパターン認識 / 音声情報処理 / 識別器統合 / ブースティング / 重み付きHLDA
研究概要

本研究では, パターン認識システムの性能向上を目指し, 1) 相補的な識別器を効率的に生成する方式, および2) 生成された複数の識別器を効果的に統合する方式について検討を行った. 本年度は, 提案方式の適用範囲を広げることを目的に, 識別器統合部において下記拡張を行った.
1) 尤度パターン特徴ベクトルの次元数削減
提案方式を音声認識に適用する場合, 生成された複数の識別器(HMM)が各識別クラス(単語)に与える尤度のパターンを特徴量として静的なパターン認識を行うことで, 識別器を統合する. しかし, この枠組みでは特徴ベクトルの次元数が語彙数と一致するため, 大語彙を扱うタスクでは特徴ベクトルの次元数が膨大になる. そこで, 認識語彙のうち識別に寄与する単語クラスのみを選択し, 得られたクラスに対する尤度のみを用いて特徴ベクトルを構成することで, 尤度特徴ベクトルの次元数を削減する方式を開発した.
提案する次元圧縮法が認識性能に与える影響を調査するため, 次元圧縮を行った尤度空間上におけるSVMを用いたパターン認識を, 単語音声認識システムのリスコアリングに適用した. その結果, 4.6%に圧縮したベクトルを特徴量とした場合においても, 次元圧縮を行わないシステムの認識性能を劣化させることなく, かつ従来のHMMを上回る性能を与えることがわかった.
2) 合成音声の利用
識別器統合部に用いるパターン認識システムでは学習データとして単語音声を必要とするため, 語彙数の増大に伴い学習データ不足の問題が生じる. この問題を解決するため, HMM音声合成方式により生成した合成音声を学習データとして識別器統合部のパターン認識システムを構築することを試みた. 識別器統合部では尤度パターン空間上で識別を行うため, HMM合成音声とは整合性が高い. この方法を用いることで, 実際の単語発話を大量に収集することなく, 提案方式を用いることが可能となった.

  • 研究成果

    (1件)

すべて 2008

すべて 雑誌論文 (1件)

  • [雑誌論文] HMMの尤度パターンを利用したリスコアリングにおける次元圧縮法の検討2008

    • 著者名/発表者名
      小川哲司, 小林哲則
    • 雑誌名

      電子情報通信学会技術研究報告 Vol.108

      ページ: 73-78

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi