• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

ベイズ基準に基づく幾何学的変動に頑健な画像認識モデルの構築

Research Project

Project/Area Number 15J08391
Research InstitutionNagoya Institute of Technology

Principal Investigator

沢田 慶  名古屋工業大学, 工学研究科, 特別研究員(DC2)

Project Period (FY) 2015-04-24 – 2017-03-31
Keywords画像認識 / 統計モデル / 隠れマルコフモデル / ベイズ基準
Outline of Annual Research Achievements

従来の統計モデルに基づく画像認識手法の多くは,モデルの学習のみに注目して研究されてきた.しかし,画像認識用の統計モデルを学習するためには,画像の切り出し,各種正規化,特徴抽出などの事前処理が必要となる.これらの事前処理は,認識対象に強く依存するため,人手による画像の切り出しやヒューリスティックな正規化処理が用いられてきたが,認識対象ごとにヒューリスティックな方法で事前処理を設計することは高いコストを必要とする.本研究では,認識対象の位置や大きさの正規化をモデル化することができる分離型格子隠れマルコフモデル (SL-HMM) や,SL-HMMと因子分析を統合した可変固有画像モデル (HMEM) に注目して,幾何学的変動に頑健なモデルの高精度化を行う.これらのモデルは従来では煩雑であった事前処理とモデルの学習を同時に最適化することができるため,認識対象ごとに事前処理を設計する必要がなく汎用性が高い手法である.
本年度は,ベイズ基準の近似計算を行う変分ベイズ法に確定的アニーリングEMアルゴリズムを適用し,HMEMの学習を行った.顔画像認識や手書き数字認識実験により,提案した学習アルゴリズムは,学習データが少量の場合であっても精度の高いHMEMを学習できることを示した. さらに,近年注目を集めているディープラーニングに基づく手法である畳み込みニューラルネットワーク (CNN) と提案法の比較実験を行った.比較実験より,学習データが少量の条件や,認識対象に位置や大きさの変動が多く含まれる条件においては,提案法はCNNより高い認識性能を示すことが確認できた.

Research Progress Status

28年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

28年度が最終年度であるため、記入しない。

  • Research Products

    (6 results)

All 2017 2016 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Acknowledgement Compliant: 1 results) Presentation (4 results) (of which Int'l Joint Research: 2 results) Remarks (1 results)

  • [Journal Article] A Bayesian approach to image recognition based on separable lattice hidden Markov models2016

    • Author(s)
      Kei Sawada, Akira Tamamori, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E99-D Pages: 3119-3131

    • DOI

      10.1587/transinf.2016EDP7112

    • Peer Reviewed / Acknowledgement Compliant
  • [Presentation] Image recognition based on discriminative models using features generated from separable lattice HMMs2017

    • Author(s)
      Yoshinari Tsuzuki, Kei Sawada, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda
    • Organizer
      2017 IEEE International Conference on Acoustics, Speech, and Signal Processing
    • Place of Presentation
      New Orleans, USA
    • Year and Date
      2017-03-05 – 2017-03-09
    • Int'l Joint Research
  • [Presentation] オーディオブックを用いた表現豊かな音声合成のための言語特徴の検討2017

    • Author(s)
      浅井 千明,沢田 慶,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      東京
    • Year and Date
      2017-01-21 – 2017-01-21
  • [Presentation] The NITech text-to-speech system for the Blizzard Challenge 20162016

    • Author(s)
      Kei Sawada, Chiaki Asai, Kei Hashimoto, Keiichiro Oura, and Keiichi Tokuda
    • Organizer
      Blizzard Challenge 2016 Workshop
    • Place of Presentation
      Cupertino, USA
    • Year and Date
      2016-09-16 – 2016-09-16
    • Int'l Joint Research
  • [Presentation] 分離型格子HMMによる特徴量生成を用いた識別モデルに基づく画像認識2016

    • Author(s)
      都築 良成,沢田 慶,橋本 佳,南角 吉彦,徳田 恵一
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      東京
    • Year and Date
      2016-06-13 – 2016-06-13
  • [Remarks] 徳田・南角研究室ホームページ

    • URL

      http://www.sp.nitech.ac.jp/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi