• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

統計的パターン解析と構造的パターン解析を融合した画像データ生成モデルの構築

研究課題

研究課題/領域番号 16K00259
研究機関仙台高等専門学校

研究代表者

大町 方子  仙台高等専門学校, 総合工学科, 教授 (90316448)

研究分担者 大町 真一郎  東北大学, 工学研究科, 教授 (30250856)
研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードパターン認識
研究実績の概要

本研究の目的は統計的にも構造的にも妥当な画像生成モデルを構築することである。まず、昨年度に引き続いて画素間の相関を考慮することで画像を意味のある領域に分割する手法について検討した。各画素をノード、画素間の相関をエッジとする完全木を考え、グラフカットの手法を応用することで画像を意味のある領域に分割する手法を実装し、実際の画像データを用いて実験を行った。また、この領域分割を活用して、分割された領域ごとに混合ガウス分布を用いてさまざまな画像を生成する実験を行い、視覚的に妥当な画像データを生成することが可能であることを確認した。本年度はさらに、ニューラルネットワークを活用する手法についても検討を行った。自己符号化器による手法をベースとしたネットワークを用い、画像に適切な前処理を加えることで画像生成が可能であることを実験的に確認した。そして、これを文書画像の検索に用いた。文書画像に含まれる文字パターンをもとに他カテゴリの文字パターンを生成し、生成された文字パターンの画像を用いて文書を検索する実験を行い、精度が向上することを確認した。さらに、文字フォント画像を対象として、文字の骨格を生成し、ストロークを表す画像を張り付けることで文字パターンの画像を生成する手法についても検討した。生成された画像を用いて文字の認識実験を行い、提案手法によって認識精度が向上することを確認した。提案手法および検証結果を国際会議で発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

画像を意味のある領域に分割する手法や画像を生成する手法について、さまざまなアプローチを検討し、それぞれ有効性を確認した。評価はまだ不十分なところがあるが、当初の目的をおおよそ達成できていると考える。

今後の研究の推進方策

これまでの検討結果をもとに、実験結果の詳細な解析を行うとともに、検討してきた手法を統合して画像生成モデルを構築する。また、さまざまな画像データを用いて検証を行う。

次年度使用額が生じた理由

理由:研究自体はほぼ順調に進んでいるが、学会発表が当初の予定よりも少なかったため旅費の支出も少なかった。また、論文執筆が遅れているため投稿に必要な費用の支出が少なかった。さらに、公開データを用いて実験を行っており、データ収集用の機器の購入やデータ整理用の謝金にかかる費用が少なかった。
使用計画:研究成果発表用の旅費や投稿論文の別刷代等に使用予定である。

  • 研究成果

    (4件)

すべて 2017

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (2件) (うち国際学会 2件)

  • [雑誌論文] Text Retrieval for Japanese Historical Documents by Image Generation2017

    • 著者名/発表者名
      Chisato Sugawara, Tomo Miyazaki, Yoshihiro Sugaya, and Shinichiro Omachi
    • 雑誌名

      Proceedings of the 2017 Workshop on Historical Document Imaging and Processing

      巻: - ページ: -

    • DOI

      DOI: 10.1145/3151509.3151512

    • 査読あり
  • [雑誌論文] Glyph-Based Data Augmentation for Accurate Kanji Character Recognition2017

    • 著者名/発表者名
      Kenichiro Ofusa, Tomo Miyazaki, Yoshihiro Sugaya, and Shinichiro Omachi
    • 雑誌名

      Proceedings of the 14th IAPR International Conference on Document Analysis and Recognition

      巻: - ページ: -

    • DOI

      10.1109/ICDAR.2017.103

    • 査読あり
  • [学会発表] Text Retrieval for Japanese Historical Documents by Image Generation2017

    • 著者名/発表者名
      Chisato Sugawara, Tomo Miyazaki, Yoshihiro Sugaya, and Shinichiro Omachi
    • 学会等名
      The 2017 Workshop on Historical Document Imaging and Processing
    • 国際学会
  • [学会発表] Glyph-Based Data Augmentation for Accurate Kanji Character Recognition2017

    • 著者名/発表者名
      Kenichiro Ofusa, Tomo Miyazaki, Yoshihiro Sugaya, and Shinichiro Omachi
    • 学会等名
      The 14th IAPR International Conference on Document Analysis and Recognition
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi