• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

高識別的特徴空間とその探索法の最小分類誤り基準に基づく統一的実現

研究課題

研究課題/領域番号 26280063
研究機関同志社大学

研究代表者

片桐 滋  同志社大学, 理工学部, 教授 (40396114)

研究分担者 中村 篤  名古屋市立大学, 大学院システム自然科学研究科, 教授 (50396206)
小川 厚徳  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員 (90527516)
吉岡 拓也  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 研究主任 (40466404) [辞退]
渡辺 秀行  株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 連携研究員 (40395091)
Delcroix Marc  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員 (70793339)
研究期間 (年度) 2014-04-01 – 2018-03-31
キーワードパターン認識 / 識別学習 / 機械学習 / カーネル法 / ニューラルネットワーク
研究実績の概要

本研究は,特徴抽出部と分類部とからなるパターン認識器の設計において,最小分類誤り(MCE)学習法に,最近のカーネル法とディープ・ニューラルネットワーク(DNN)に基づく特徴写像法を加えて,理想的な最小分類誤り確率(ベイズリスク)状態の達成に一貫する形で認識器全体を最適設計する手法の確立を目指すものである.以下にサブテーマ毎の進捗を要約する.
(1)可変長パターンのための大幾何マージン最小分類誤り(LGM-MCE)学習:状態遷移型クラスモデルを用いた動的時間軸伸縮を伴うLGM-MCE学習法を完成させ,その有効性を音声単語認識実験によって示すことができた.(2)カーネル最小分類誤り(KMCE)学習法の評価と改良:多クラスサポートベクターマシン(MSVM: Multi-class SVM)によって生成されるサポートベクター(SV)を,ほとんどその識別力を低下させることなく大幅に削減できることを明らかにした.(3)話者正規化(SAT)型DNNの改良:グループラッソ法を利用し,線形ネットワークの挿入を必要とせず,かつネットワーク学習の段階において直接,大幅なDNNノードの削減が可能であることを示した.(4)超多クラス分類課題のための高効率解探索法の開発:MCE法のような識別学習には必須と考えられてきた正解情報を用いずに,認識結果とクラス素性を基に認識率を正確に推定する手法の構築に成功した.(5)ハイパーパラメータを用いずに高い未知標本耐性を達成する学習法の開発:標本分布が疎な領域におけるLGM-MCE法によるベイズリスク推定精度を高めることを目指し,標本重み付きパルツェン推定による平滑分類誤り数損失平滑度設定法を構築し,また平滑度の自動推定法の有効性の検証を行った.さらに,誤分類尺度空間においてベイズリスク状態が成立するための必要条件を発見し,その妥当性を予備実験によって確認した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

各サブテーマで得られた成果に対し,それぞれ以下のような評価をしていることに由来する.
(1)動的時間軸伸縮を伴うLGM-MCE学習法:可変長パターンどうしの厳密な幾何マージンを定式化するには至っていないものの,音声認識を含む広範な可変長時系列パターンの認識に自然に適用できる手法の有効性をほぼ確認することができた.(2)KMCE学習法がもつSV削減効果:SVMがもつスケーラビリティの問題を大きく改善する手法として広く利用される可能性がある.また,クラス境界付近におけるSVの位置に基づいて分類の難易度を推定する手法を構築した.(3)グループラッソ法等を用いる無駄のないSAT-DNN音声認識器の構築:計算速度や必要とされる記憶容量などの様々な面で問題となっていたDNN型認識器の無駄を大幅に削減し,利用可能性を高め,また学習パラメータ数を減らすことでその適応力の向上にも道を拓いた.(4)認識結果とクラス素性から認識率を推定する手法の開発:基本的に正解情報を必要とするLGM-MCE学習法やDNNの学習法(クロスエントロピー最小化法など)を,正解情報の整備が不完全でも利用することを可能とする道を拓いた.(5)標本重み付きパルツェン推定によるLGM-MCE学習法や誤分類尺度空間におけるベイズリスク状態達成条件に関する分析:SVMやDNNなどの強力な手法の多くで当然と思われている,検証用標本を用いたハイパーパラメータの最適化を不要とすることで,あるいはハイパーパラメータ数を減らすことで,結果的にベイズリスクの推定精度を高めることができる.また,誤分類尺度空間におけるベイズリスク成立の必要条件が明らかになることで,これまで実用性が必ずしも高いとは言えなかった,分類器モデルサイズの最適化法や過学習を回避するための学習基準の構築に道を拓いた.

今後の研究の推進方策

サブテーマ毎に今後の進め方を要約する.
(1)動的時間軸伸縮を伴うLGM-MCE学習法:パターン空間における如何なる距離も,分類判断段階では誤分類尺度空間上の距離と置き換えられる.この点を考慮し,可変長パターンにかかわる距離(あるいは幾何マージン)には動的時間軸伸縮に基づくこれまでの成果を採用し,その距離が反映される誤分類尺度空間におけるベイズリスク推定精度の向上を重点的に目指す.このアプローチは,以下の(5)項と深く関係する.また,実験データを増やし,評価の信頼性も高める.(2)KMCE学習法がもつSV削減効果:可変長パターン用のKMCE法の構築を目指す.動的時間軸伸縮を用いて近似的にカーネル計算を行う手法の利用を検討する.(3)無駄のないSAT-DNN音声認識器の構築:特異値分解やグループラッソ法を伴う学習法の有効性をさらに検証し,また多層構造内における特徴表現とベイズリスク(特にその低減効果)との関係等の分析を進める.(4)認識結果とクラス素性から認識率を推定する手法の開発:構築した認識率推定法をLGM-MCE学習やDNNの学習に適用し,その有用性を調査する.(5)標本重み付きパルツェン推定によるLGM-MCE学習法や誤分類尺度空間におけるベイズリスク状態達成条件に関する分析:誤分類尺度空間におけるベイズリスク状態成立の必要条件を精査し,その条件を満足するための学習法の構築を目指す.また,これまで行ってきた,分類誤り数損失の平滑度の自動設定法や,KMCE法,DNN型認識器,可変長パターンのためのLGM-MCE法などに関する各サブテーマの研究を統合し,検証用標本を用いずとも高い分類精度を自動的に達成できる汎用的学習法の構築を目指す.
また,いずれのサブテーマにおいても,得られている技術の実験的評価をより充実させ,その評価結果の公表にも注力する.

次年度使用額が生じた理由

年度後半に得られた着想に関する学会発表を計画していたが,評価実験等に手間取り,急きょ予定を変更せざるを得なかったため.

次年度使用額の使用計画

最終年度のため,論文投稿や会議発表を重点的に行う予定である.そのための,投稿料や英文添削費等に充当する.

  • 研究成果

    (11件)

すべて 2017 2016

すべて 雑誌論文 (3件) (うち査読あり 3件、 謝辞記載あり 3件) 学会発表 (8件) (うち国際学会 1件)

  • [雑誌論文] 音声言語処理における深層学習ツールキット解説2017

    • 著者名/発表者名
      落合翼,松廣達也,松田繁樹,片桐滋
    • 雑誌名

      日本音響学会誌

      巻: 1 ページ: 63-72

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Speaker Adaptive Training Localizing Speaker Modules in DNN for Hybrid DNN-HMM Speech Recognizers2016

    • 著者名/発表者名
      Tsubasa Ochiai, Shigeki Matsuda, Hideyuki Watanabe, Xugang Lu, Chiori Hori, Hisashi Kawai, Shigeru Katagiri
    • 雑誌名

      IEICE Transactions on Information & Systems

      巻: E99-D ページ: 2431-2433

    • DOI

      10.1587/transinf.2016SLP0010

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Estimating speech recognition accuracy based on error type classification2016

    • 著者名/発表者名
      Atsunori Ogawa, Takaaki Hori, Atsushi Nakamura,
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 24 ページ: 2400-2413

    • DOI

      10.1109/TASLP.2016.2603599

    • 査読あり / 謝辞記載あり
  • [学会発表] ベイズリスク推定を目指す誤分類尺度の分析2017

    • 著者名/発表者名
      友利宥也, David Ha, 片桐滋, 渡辺秀行, 大崎美穂
    • 学会等名
      2017年電子情報通信学会総合大会
    • 発表場所
      名城大学天白キャンパス(愛知県・名古屋市)
    • 年月日
      2017-03-23 – 2017-03-23
  • [学会発表] 最小分類誤り学習法における損失平滑度のクラス共通型自動設定法の実験的評価2017

    • 著者名/発表者名
      小林和馬, 渡辺秀行, 片桐滋, 大崎美穂
    • 学会等名
      2017年電子情報通信学会総合大会
    • 発表場所
      名城大学天白キャンパス(愛知県・名古屋市)
    • 年月日
      2017-03-23 – 2017-03-23
  • [学会発表] 大幾何マージン最小分類誤り学習法の未知標本耐性に関する実験的評価2017

    • 著者名/発表者名
      塩崎謙, ア デイビッド, 渡辺秀行, 片桐滋, 大崎美穂
    • 学会等名
      2017年電子情報通信学会総合大会
    • 発表場所
      名城大学天白キャンパス(愛知県・名古屋市)
    • 年月日
      2017-03-23 – 2017-03-23
  • [学会発表] Automatic Node Selection for Deep Neural Networks Using Group Lasso Regularization2017

    • 著者名/発表者名
      Tsubasa Ochiai, Shigeki Matsuda, Hideyuki Watanabe, Shigeru Katagiri
    • 学会等名
      2017 IEEE International Conference on Acoustics, Speech and Signal Processing
    • 発表場所
      ニューオーリンズ(米国)
    • 年月日
      2017-03-08 – 2017-03-08
    • 国際学会
  • [学会発表] 最小分類誤り基準に基づくサポートベクター再学習による小規模カーネル分類器2017

    • 著者名/発表者名
      谷陵真, 渡辺秀行, 片桐滋, 大崎美穂
    • 学会等名
      電子情報通信学会「パターン認識・メディア理解」研究会
    • 発表場所
      北海道大学大学院情報科学研究科(北海道・札幌市)
    • 年月日
      2017-02-18 – 2017-02-18
  • [学会発表] 大幾何マージン最小分類誤り学習法を用いた音声認識に関する実験的評価2016

    • 著者名/発表者名
      松廣達也, 北岡見生代, ア デイビッド, 渡辺秀行, 片桐滋, 大崎美穂
    • 学会等名
      2016年度情報処理学会関西支部大会
    • 発表場所
      大阪大学中之島センター(大阪府・大阪市)
    • 年月日
      2016-09-26 – 2016-09-26
  • [学会発表] モデルサイズから見たカーネル最小分類誤り学習法の有用性の検証2016

    • 著者名/発表者名
      谷陵真, 渡辺秀行, 片桐滋, 大崎美穂
    • 学会等名
      2016年度情報処理学会関西支部大会
    • 発表場所
      大阪大学中之島センター(大阪府・大阪市)
    • 年月日
      2016-09-26 – 2016-09-26
  • [学会発表] LGM-MCE Training Based on Parzen Estimation with Sample Weighting2016

    • 著者名/発表者名
      David Ha, Hideyuki Watanabe, Shigeru Katagiri, Miho Ohsaki
    • 学会等名
      2016年度情報処理学会関西支部大会
    • 発表場所
      大阪大学中之島センター(大阪府・大阪市)
    • 年月日
      2016-09-26 – 2016-09-26

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi