• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

ベイズ基準に基づく幾何学的変動に頑健な画像認識モデルの構築

研究課題

研究課題/領域番号 15J08391
研究機関名古屋工業大学

研究代表者

沢田 慶  名古屋工業大学, 工学研究科, 特別研究員(DC2)

研究期間 (年度) 2015-04-24 – 2017-03-31
キーワード画像認識 / 統計モデル / 隠れマルコフモデル / ベイズ基準
研究実績の概要

従来の統計モデルに基づく画像認識手法の多くは,モデルの学習のみに注目して研究されてきた.しかし,画像認識用の統計モデルを学習するためには,画像の切り出し,各種正規化,特徴抽出などの事前処理が必要となる.これらの事前処理は,認識対象に強く依存するため,人手による画像の切り出しやヒューリスティックな正規化処理が用いられてきたが,認識対象ごとにヒューリスティックな方法で事前処理を設計することは高いコストを必要とする.本研究では,認識対象の位置や大きさの正規化をモデル化することができる分離型格子隠れマルコフモデル (SL-HMM) や,SL-HMMと因子分析を統合した可変固有画像モデル (HMEM) に注目して,幾何学的変動に頑健なモデルの高精度化を行う.これらのモデルは従来では煩雑であった事前処理とモデルの学習を同時に最適化することができるため,認識対象ごとに事前処理を設計する必要がなく汎用性が高い手法である.
本年度は,ベイズ基準の近似計算を行う変分ベイズ法に確定的アニーリングEMアルゴリズムを適用し,HMEMの学習を行った.顔画像認識や手書き数字認識実験により,提案した学習アルゴリズムは,学習データが少量の場合であっても精度の高いHMEMを学習できることを示した. さらに,近年注目を集めているディープラーニングに基づく手法である畳み込みニューラルネットワーク (CNN) と提案法の比較実験を行った.比較実験より,学習データが少量の条件や,認識対象に位置や大きさの変動が多く含まれる条件においては,提案法はCNNより高い認識性能を示すことが確認できた.

現在までの達成度 (段落)

28年度が最終年度であるため、記入しない。

今後の研究の推進方策

28年度が最終年度であるため、記入しない。

  • 研究成果

    (6件)

すべて 2017 2016 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (4件) (うち国際学会 2件) 備考 (1件)

  • [雑誌論文] A Bayesian approach to image recognition based on separable lattice hidden Markov models2016

    • 著者名/発表者名
      Kei Sawada, Akira Tamamori, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E99-D ページ: 3119-3131

    • DOI

      10.1587/transinf.2016EDP7112

    • 査読あり / 謝辞記載あり
  • [学会発表] Image recognition based on discriminative models using features generated from separable lattice HMMs2017

    • 著者名/発表者名
      Yoshinari Tsuzuki, Kei Sawada, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda
    • 学会等名
      2017 IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 発表場所
      New Orleans, USA
    • 年月日
      2017-03-05 – 2017-03-09
    • 国際学会
  • [学会発表] オーディオブックを用いた表現豊かな音声合成のための言語特徴の検討2017

    • 著者名/発表者名
      浅井 千明,沢田 慶,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一
    • 学会等名
      電子情報通信学会技術研究報告
    • 発表場所
      東京
    • 年月日
      2017-01-21 – 2017-01-21
  • [学会発表] The NITech text-to-speech system for the Blizzard Challenge 20162016

    • 著者名/発表者名
      Kei Sawada, Chiaki Asai, Kei Hashimoto, Keiichiro Oura, and Keiichi Tokuda
    • 学会等名
      Blizzard Challenge 2016 Workshop
    • 発表場所
      Cupertino, USA
    • 年月日
      2016-09-16 – 2016-09-16
    • 国際学会
  • [学会発表] 分離型格子HMMによる特徴量生成を用いた識別モデルに基づく画像認識2016

    • 著者名/発表者名
      都築 良成,沢田 慶,橋本 佳,南角 吉彦,徳田 恵一
    • 学会等名
      電子情報通信学会技術研究報告
    • 発表場所
      東京
    • 年月日
      2016-06-13 – 2016-06-13
  • [備考] 徳田・南角研究室ホームページ

    • URL

      http://www.sp.nitech.ac.jp/

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi