• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

高識別的特徴空間とその探索法の最小分類誤り基準に基づく統一的実現

研究課題

研究課題/領域番号 26280063
研究機関同志社大学

研究代表者

片桐 滋  同志社大学, 理工学部, 教授 (40396114)

研究分担者 堀 貴明  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員 (20396211)
渡辺 秀行  独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所, 主任研究員 (40395091)
中村 篤  名古屋市立大学大学院, システム自然科学研究科, 教授 (50396206)
研究期間 (年度) 2014-04-01 – 2018-03-31
キーワードパターン認識 / 識別学習
研究実績の概要

本研究は,それぞれ独立に最適化がなされることが多い特徴抽出部と分類部とから成るパターン認識器の設計において,最小分類誤り(MCE)学習法に,最近のカーネル法とディープ・ニューラル・ネットワーク(DNN)に基づく特徴写像法を加えて,理想的な最小分類誤り確率状態の達成に一貫する形で認識器全体を最適設計する手法の確立を目指すものである.以下にサブテーマ毎に進捗を要約する.
(1)可変長パターンのための幾何マージンの導出および大幾何マージン最小分類誤り(LGM-MCE)学習法の開発:当初の計画に沿って,入力パターン長をパターン空間の次元とし,さらに動的計画法によって得られる最小累積(ローカル)距離をパターン間距離とすることで,近似的な幾何マージンを導出し,それを用いた可変長パターンのためのLGM-MCE学習法の定式化と動作確認を行った.規模は小さいながらも,実験を通して,従来法に対する本手法の有効性を示すことができた.
(2)MCE基準に基づくDNNを用いる識別的特徴抽出法の開発:DNNにモジュール構造を導入する新しい適応学習法を開発することで,高い適応能力を持つ特徴抽出器の実現に成功した.成果は,日本音響学会から発表表彰を得るなど,内外の学会発表において高い評価を得るに至っている.
(3)超多クラス分類課題のためのMCE学習を利用した高効率解探索法の開発:MCEと近縁の最小リスク学習を用い,DNN特徴抽出器の後段にある隠れマルコフモデル(HMM)分類器の構造最適化法を開発した.また,リカレントニューラルネットワーク型言語モデルを用いて高い精度で解候補を統合するデコーディング法の開発にも成功した.
(4)識別学習のためのモデルサイズ最適化法の開発:幾何マージンを用いて認識器モデルサイズの最適化を行う着想を得,その基礎となる,幾何マージンのふるまいに関する実験データの分析を進めた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

可変長パターンのための数理的に完成度の高い幾何マージンを得るには至っていないものの,動的時間軸伸縮に基づく可変長パターンのための幾何マージンの定義と,それを用いたLGM-MCE学習法およびカーネルMCE学習法の定式化を行うに至った.
また,DNNにモジュール構造を導入した適応学習法に関しては,当該分野において国際的に最高水準にある国際会議(ICASSP)で成果を発表するに至り,かつDNN内部の特徴表現のあり様を調査した研究に関しては,日本音響学会で学生優秀発表賞を受賞することができた.
超多クラス分類のための高効率解探索法に関しても,最小リスク学習やリカレントニューラルネット型言語モデルを用いた手法の開発に成功し,ほぼ計画通りの進捗があった.
さらに,申請時には具体化をしていなかったものではあるが,本研究の進展に重要な基盤となる幾何マージンを用いた認識器モデルパラメータサイズの最適化(未知標本を高めるパラメータサイズの発見)手法の着想を得るに至った.まだ初期段階にあるが,今期,この着想の基礎を固めるために,幾何マージンのふるまいを様々な実験結果の分析を通して行い,ほぼ期待通りに幾何マージンが動作することの確認を行った.
以上のように,計画の各項目において,かつそこから発展し,本研究の進展を一層強く支えることが期待できる研究項目に着手するなど,おおむね計画通りの進展があったものと考えている.

今後の研究の推進方策

可変長パターンのための幾何マージンやカーネル法に関する研究では,当初の計画に沿って引き続き研究を進める予定である.特に今後は,これまでに定形化を行ったLGM-MCE法やカーネルMCE法の実験的評価とその結果の分析に注力したい.
一方,注目を集める成果となっているDNNの研究を特に強化促進するため,当該分野に造詣の深い研究分担者を新たに迎えることとした.この新しい体制によって,超多クラス分類課題のためのサブテーマとDNN特徴抽出器に関するサブテーマとの統合を進め,かつDNNのモジュール化に関するより効果的な手法の開発や,特徴抽出と分類とを統合するDNNの利用法などの研究を加速する予定である.

次年度使用額が生じた理由

H26年度は,それぞれのサブテーマにおいて,問題や手法の定形化がほぼ当初の計画通りに進展し,加えて幾何マージンを用いるモデルサイズ最適化法のサブテーマに発展するなど,特に研究の理論的側面において順調に進捗した.しかし,その一方で,定形化結果の検証に必要となる高度なソフトウェアの開発に手間取り,サブテーマによっては実験の規模拡大に多少の遅れが生じてしまった.その結果として,評価試験用PCサーバの導入が遅れるなどしたためである.

次年度使用額の使用計画

次年度使用額が生じた理由でふれた,規模の大きな評価実験の実施を加速するため,H27年度請求分の研究費と合わせて,評価試験用PCサーバおよび評価試験用ブレードサーバ等の購入に充当する.

  • 研究成果

    (12件)

すべて 2015 2014

すべて 学会発表 (12件) (うち招待講演 1件)

  • [学会発表] 大幾何マージン最小分類誤り学習法を用いた音声パターン認識2015

    • 著者名/発表者名
      橋本哲也,北岡見生代,渡辺秀行,片桐滋,ル シュガン,堀智織,大崎美穂
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      東京都文京区
    • 年月日
      2015-03-16 – 2015-03-16
  • [学会発表] 線形変換ネットワークを用いて話者正規化学習されたディープニューラルネットワークによる教師なし話者適応2015

    • 著者名/発表者名
      落合翼,松田繁樹,渡辺秀行,Xugang Lu,堀智織,片桐滋
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      東京都文京区
    • 年月日
      2015-03-16 – 2015-03-16
  • [学会発表] ビットストリング型遺伝的アルゴリズムを用いた最小分類誤り学習の分析2015

    • 著者名/発表者名
      外越寛人,渡辺秀行,片桐滋,ル シュガン,堀智織,大崎美穂
    • 学会等名
      電子情報通信学会 パターン認識・メディア理解研究会
    • 発表場所
      奈良県生駒市
    • 年月日
      2015-01-23 – 2015-01-23
  • [学会発表] 大幾何マージン最小分類誤り学習法におけるデータ分割法と未知標本耐性の関係について2015

    • 著者名/発表者名
      白石裕之,渡辺秀行,片桐滋,ル シュガン,堀智織,大崎美穂
    • 学会等名
      電子情報通信学会 パターン認識・メディア理解研究会
    • 発表場所
      奈良県生駒市
    • 年月日
      2015-01-23 – 2015-01-23
  • [学会発表] How Can We Make a System Robust to Unseen Data?2014

    • 著者名/発表者名
      Shigeru Katagiri
    • 学会等名
      6th World Congress of The Ararat International Academy of Sciences
    • 発表場所
      Jerusalem, Israel
    • 年月日
      2014-10-24 – 2014-10-24
    • 招待講演
  • [学会発表] 幾何マージン増大型学習におけるデータ分割法について2014

    • 著者名/発表者名
      白石裕之,竹中一馬,渡辺秀行,片桐滋,大崎美穂,堀智織
    • 学会等名
      情報処理学会関西支部 支部大会
    • 発表場所
      大阪府大阪市
    • 年月日
      2014-09-17 – 2014-09-17
  • [学会発表] 最小分類誤り学習法におけるプロトタイプ数の自動的最適化手法の実験的評価2014

    • 著者名/発表者名
      荻野将大,渡辺秀行,片桐滋,大崎美穂,堀智織
    • 学会等名
      情報処理学会関西支部 支部大会
    • 発表場所
      大阪府大阪市
    • 年月日
      2014-09-17 – 2014-09-17
  • [学会発表] Restructuring Output Layers of Deep Neural Networks using Minimum Risk Parameter Clustering2014

    • 著者名/発表者名
      Yotaro Kubo, Jun Suzuki, Takaaki Hori, and Atsushi Nakamura
    • 学会等名
      15th Annual Conference of the International Speech Communication Association (INTERSPEECH 2014)
    • 発表場所
      Singapore, Republic of Singapore
    • 年月日
      2014-09-14 – 2014-09-14
  • [学会発表] Bidirectional RNNを用いた音声認識誤り検出と認識率推定2014

    • 著者名/発表者名
      小川厚徳,堀貴明
    • 学会等名
      日本音響学会 2014年秋季研究発表会
    • 発表場所
      北海道札幌市
    • 年月日
      2014-09-03 – 2014-09-03
  • [学会発表] ネットワークの内部特徴表現における音韻間及び話者間変動に基づいたDNNの動作分析2014

    • 著者名/発表者名
      落合翼,松田繁樹,渡辺秀行,片桐滋,大崎美穂,Xugang Lu,堀智織
    • 学会等名
      日本音響学会 2014年秋季研究発表会
    • 発表場所
      北海道札幌市
    • 年月日
      2014-09-03 – 2014-09-03
  • [学会発表] Speaker Adaptive Training Using Deep Neural Networks2014

    • 著者名/発表者名
      Tsubasa Ochiai, Shigeki Matsuda, Xugang Lu, Chiori Hori, and Shigeru Katagiri
    • 学会等名
      39th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2014)
    • 発表場所
      Florence, Italy
    • 年月日
      2014-05-09 – 2014-05-09
  • [学会発表] Real-time One-pass Decoding with Recurrent Neural Network Language Model for Speech Recognition2014

    • 著者名/発表者名
      Takaaki Hori, Yotaro Kubo, and Atsushi Nakamura
    • 学会等名
      39th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2014)
    • 発表場所
      Florence, Italy
    • 年月日
      2014-05-04 – 2014-05-04

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi