• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

システム協調型適応学習に基づくパターン認識システムの全体最適化に関する研究

Research Project

Project/Area Number 25330207
Research Category

Grant-in-Aid for Scientific Research (C)

Research InstitutionWaseda University

Principal Investigator

小川 哲司  早稲田大学, 理工学術院, 准教授 (70386598)

Project Period (FY) 2013-04-01 – 2016-03-31
Keywordsパターン認識 / 全体最適化 / 行動モデリング
Research Abstract

本研究では,人の行動をモニタリングし,状況に応じて適切な行動を推薦するためのシステムの開発を通じ,複雑な依存関係を有する複数のパターン認識システムを協調的に最適化しながら,システム全体を効率的かつ自動で成長させる方式を開発する.平成25年度はこのうち,状況変化に頑健でかつ複雑な依存関係を扱えるパターン認識の基本方式開発を重点的に行い,複数人による会議や対話型講義のマイニングにおいて重要な情報となる発話内容や発話者の認識によって評価を行った.
【25-1】状況変化に対して最適な識別器を逐次選択するマルチストリーム型パターン認識方式の開発:複雑な依存関係を一つの識別器で扱うのではなく,取り得る依存関係の組み合わせごとにディープ・ニューラルネットワークに基づく識別器を予め構築しておき,最適な識別器を時々刻々選択的に用いることで,環境の変化や未知の環境に対して頑健なパターン認識を実現した.提案方式を雑音下音声認識システムに適用し,未知雑音下において頑健に高い性能を達成した.
【25-2】状況変化に頑健な識別的特徴の抽出機能を備えた識別器の構築方式の開発:周辺環境の変化により生じるクラス内変動に対して頑健に高い性能を与えるため,条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いて識別器を構築し,環境変動の影響を受けやすい少量データ条件下において従来の話者照合システムを上回る性能を達成した.
【25-3】潜在的行動クラスタリングの基礎的検討:複雑な分布構造を有するデータを階層構造を持つ分布によって記述するとともに,人の行動モデリングにおいても対象となる時系列データに適したモデル化を行い,かつクラス数を自動推定可能なモデル推定方式について検討を行った.本年度は,提案モデルに適したサンプリング手法に焦点を当てて検討を行い,発話者のクラスタリングにおいて従来方式を上回る性能を達成した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

平成25年度の実施計画においては,「複雑な依存関係を有する複数のパターン認識システムを状況に応じて協調的に最適化しながら,システム全体を効率的かつ自動で成長させる」ための基本方式として,【25-1】周辺状況の変化に対するパターン認識システムのオンライン最適化方式,および【25-2】周辺状況の変化に頑健な識別的な特徴抽出を伴う識別器の開発を重点的におこなう計画であった.【25-1】については雑音下音声認識システム,【25-2】については話者照合システムに適用し,その研究成果を査読付き国際会議にて発表した.また,【25-3】は,平成26年度に行う予定であった項目を一部前倒しして行ったものである.したがって,研究の進捗状況はおおむね実施計画通りに進展していると言える.これら基本方式開発は本研究の根幹を成す最も重要な検討項目であるため,データ収集よりも優先して検討を行った.
なお,実施計画においては行動モニタリングの対照として主に複数人による会議を想定していたが,対話型講義を視野に入れることとした.これは,オンライン講義が世界中で広がりを見せ,講義における様々なデータをWebから効率的に収集できる環境が急速に整備されていることを鑑みたものである.行動推薦用データ収録については,次年度も継続して検討を進める予定である.

Strategy for Future Research Activity

平成26年度は,前年度に引き続き,システムを使用者や使用環境の違いにより生じるデータの変動に応じて適応的に改善する方式(【26-1】)と,その改善の効果を全ての認識システムに反映させるシステム間の協調的な全体最適化(【26-2】)について検討を行い,行動モニタリングデータにより評価を行う(【26-3】).
【26-1】潜在的行動クラスタリングおよび認識属性間関連度推定:行動推薦システムおよびそれを構成する認識システムをデータの変動に応じて適応的に改善し,かつシステム間で協調的に最適化するための基幹技術として,行動モニタリングデータをクラスタリングする方式を開発する.ここでは,モニタリングデータ全てを用いて似ているデータをクラスタリングするのみならず,システム間での協調的な最適化を考慮して,認識属性間の特徴量の関連度についても抽出することを試みる.
【26-2】システム協調型適応学習に基づく行動推薦システムの全体最適化:個々の認識システムにおいて教師ラベルが得られるなどしてシステムが改善された場合,その効果を伝搬させて他の認識システムおよび上段の行動推薦システムを効率的に最適化する方式を開発する.ここでは,【26-1】で検討したモニタリングデータの属性間における特徴の関連度を用いて,属性の枠を超えて認識システムを改善するアプローチと,全ての認識システムを同一の構造を持つモデルで表現し,そのパラメータを共有して学習を行うことで,個々の認識システムの改善を他の認識システムに反映するアプローチについて検討を行う.
【26-3】行動モニタリングデータとして対話型講義データの収集を行う.また,本データベースを用いて【26-1】および【26-2】の評価を行う.なお,現在Web上で公開されているオンライン講義データも積極的に活用する予定である.

Expenditure Plans for the Next FY Research Funding

予定していた国内学会出張と国際会議発表の日程が重複したことにより取りやめた国内学会出張の旅費に相当する.次年度は,高性能な計算機設備の購入が見込まれるため,次年度に使用することにした.
「今後の研究の推進方策」における【26-1】および【26-2】に関して,対話型講義の音声や画像情報を用いてシステムを時々刻々改善するための高速な演算処理能力を持つ計算機設備として,高性能なCPUおよびGPUを備えたワークステーションを購入する.また,成果発表として国内外の学会への参加や研究ディスカッションのための出張旅費が必要である.

  • Research Products

    (8 results)

All 2014 2013

All Journal Article (5 results) (of which Peer Reviewed: 3 results) Presentation (3 results)

  • [Journal Article] i-vectorを用いた話者認識2014

    • Author(s)
      小川哲司,塩田さやか
    • Journal Title

      日本音響学会誌

      Volume: 70 Pages: 332-339

  • [Journal Article] Integration of MKL-based and i-vector-based speaker verification by short utterances2013

    • Author(s)
      Hideitsu Hino and Tetsuji Ogawa
    • Journal Title

      Proc. ACML2013

      Volume: -- Pages: --

    • Peer Reviewed
  • [Journal Article] Blocked Gibbs sampling based multi-scale mixture model for speaker clustering on noisy data2013

    • Author(s)
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, and Tetsunori Kobayashi
    • Journal Title

      Proc. MLSP2013

      Volume: -- Pages: --

    • Peer Reviewed
  • [Journal Article] Stream selection and integration in multistream ASR using GMM-based performance monitoring2013

    • Author(s)
      Tetsuji Ogawa, Feipeng Li, and Hynek Hermansky
    • Journal Title

      Proc. Interspeech2013

      Volume: -- Pages: 3332-3336

    • Peer Reviewed
  • [Journal Article] 話者認識で用いる機械学習2013

    • Author(s)
      小川哲司,松井知子
    • Journal Title

      日本音響学会誌

      Volume: vol.69, no.7 Pages: 349-356

  • [Presentation] 標準話者母音スペクトルへの変換に基づく話者正準化2014

    • Author(s)
      久保田雄一,大町基,小川哲司,小林哲則,新田恒雄
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      日本大学理工学部(東京都千代田区)
    • Year and Date
      20140310-20140312
  • [Presentation] 因子分析モデルに基づく話者照合の環境変動に対する頑健性の調査2013

    • Author(s)
      福地佑介, 俵直弘, 小川哲司, 小林哲則
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学(愛知県豊橋市)
    • Year and Date
      20130925-20130927
  • [Presentation] 効率的なサンプリング手法を用いた話者モデリング2013

    • Author(s)
      俵直弘,小川哲司,渡部晋治,中村篤,小林哲則
    • Organizer
      情報処理学会音声言語情報処理研究会
    • Place of Presentation
      遠刈田温泉壮鳳(宮城県刈田郡)
    • Year and Date
      20130525-20130527

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi