• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

機械学習のためのパラメトリック画像生成モデルの構築

研究課題

研究課題/領域番号 19K12033
研究機関仙台高等専門学校

研究代表者

大町 方子  仙台高等専門学校, 総合工学科, 教授 (90316448)

研究分担者 大町 真一郎  東北大学, 工学研究科, 教授 (30250856)
研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードパターン認識
研究実績の概要

本研究では、多様かつ解釈性が高い画像生成モデルを開発し、高精度な画像認識を実現することを目的としている。そのための要素技術として、高精細な画像を生成する手法、画像を基本要素へ分解する手法などを開発している。
画像生成に関しては、文字画像を対象とし、文字ストロークにパターンを貼り付ける手法を検討した。ストロークは文字固有の原型を基本とし、パラメトリックに変形することが可能であり、さまざまに変形した文字ストロークを生成することが可能である。ストロークと貼り付けるパターンとの組合せにより多様なデータを生成する見通しが得られた。一方で、画像の欠損領域を修復するアルゴリズムを活用して画像を生成する手法を検討した。すなわち、周囲の情報をもとに欠損領域を予測して生成する考え方を応用し、分割された他の領域の情報を活用してある領域の画像を生成する。実際の画像を用いて実験を行い、生成された画像がどの程度学習データとして使用できるかを検討した。
画像データを基本要素へ分解する手法については、漢字の文字画像を題材とし、その文字がどのような要素の組み合わせで構成されるかを機械学習の手法を用いて判定する実験を行った。その結果、多クラス分類よりも複数の二クラス分類の方が高精度であること、ストローク単位よりも部首単位のほうが適切な特徴抽出が可能である等の知見が得られた。また、この実験を通して、画像全体の生成モデルを用いなくとも、部分画像の生成モデルを用いて部分画像を学習させることにより漢字全体を認識できる可能性が示された。この手法を発展させることにより、一般的な画像の場合にもその画像を構成する部分領域の学習により画像全体の認識を実現することが可能になると考えられる。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

領域分割や画像生成等の要素技術について一定の成果が得られた。一方で、これらを統合したアルゴリズムについての検討はあまり進んでいない。

今後の研究の推進方策

本年度検討したいくつかの項目について引き続き検討するとともに、開発した技術を組み合わせることで画像生成モデルを構築する。さらにこれを画像認識に応用する手法について検討する。本年度検討したいくつかの要素技術について引き続き検討するとともに、開発した技術を組み合わせることで画像生成モデルを構築する。さらにこれを画像認識に応用する手法について検討する。

次年度使用額が生じた理由

理由:本年度は基本アルゴリズムの開発に注力したために、大量データを用いた大規模な実験までは行えなかった。また、新型コロナウイルス感染症等の影響もあり学会発表が困難であった。
使用計画:実験用の機器の購入、学会発表の旅費、論文投稿の費用や別刷代等に使用予定である。

  • 研究成果

    (7件)

すべて 2021 2020

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (6件) (うち国際学会 4件)

  • [雑誌論文] Fidelity-Controllable Extreme Image Compression with Generative Adversarial Networks2021

    • 著者名/発表者名
      Shoma Iwai, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi
    • 雑誌名

      Proceedings of the 25th International Conference on Pattern Recognition

      巻: - ページ: 8235~8242

    • 査読あり
  • [学会発表] Extraction of important text information from images2021

    • 著者名/発表者名
      Shinichiro Omachi
    • 学会等名
      Symposium of Yotta Informatics Research Platform for Yotta-Scale Data Science 2021
    • 国際学会
  • [学会発表] Fidelity-Controllable Extreme Image Compression with Generative Adversarial Networks2021

    • 著者名/発表者名
      Shoma Iwai, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi
    • 学会等名
      25th International Conference on Pattern Recognition
    • 国際学会
  • [学会発表] 打突動作中の姿勢に注目した剣道競技者の打突部位判定手法の提案2021

    • 著者名/発表者名
      速水伸幸, 渡邊 隆, 大町方子
    • 学会等名
      日本機械学会 東北学生会 卒業研究発表講演会
  • [学会発表] 瞬間中心を利用したフープ材重ね合わせ法の提案2021

    • 著者名/発表者名
      穴澤友了, 渡邊 隆, 大町方子
    • 学会等名
      日本機械学会 東北学生会 卒業研究発表講演会
  • [学会発表] Survey of Automatic Video Colorization by DeepNeural Network2020

    • 著者名/発表者名
      Takuto Toida, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi
    • 学会等名
      The 17th International Workshop on Emerging ICT
    • 国際学会
  • [学会発表] Two-Stage Training for High-Fidelity Image Compression with Generative Adversarial Networks2020

    • 著者名/発表者名
      Shoma Iwai, Tomo Miyazaki, Yoshihiro Sugaya, and Shinichiro Omachi
    • 学会等名
      The 17th International Workshop on Emerging ICT
    • 国際学会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi