2020 Fiscal Year Research-status Report
機械学習のためのパラメトリック画像生成モデルの構築
Project/Area Number |
19K12033
|
Research Institution | Sendai National College of Technology |
Principal Investigator |
大町 方子 仙台高等専門学校, 総合工学科, 教授 (90316448)
|
Co-Investigator(Kenkyū-buntansha) |
大町 真一郎 東北大学, 工学研究科, 教授 (30250856)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | パターン認識 |
Outline of Annual Research Achievements |
本研究では、多様かつ解釈性が高い画像生成モデルを開発し、高精度な画像認識を実現することを目的としている。そのための要素技術として、高精細な画像を生成する手法、画像を基本要素へ分解する手法などを開発している。 画像生成に関しては、文字画像を対象とし、文字ストロークにパターンを貼り付ける手法を検討した。ストロークは文字固有の原型を基本とし、パラメトリックに変形することが可能であり、さまざまに変形した文字ストロークを生成することが可能である。ストロークと貼り付けるパターンとの組合せにより多様なデータを生成する見通しが得られた。一方で、画像の欠損領域を修復するアルゴリズムを活用して画像を生成する手法を検討した。すなわち、周囲の情報をもとに欠損領域を予測して生成する考え方を応用し、分割された他の領域の情報を活用してある領域の画像を生成する。実際の画像を用いて実験を行い、生成された画像がどの程度学習データとして使用できるかを検討した。 画像データを基本要素へ分解する手法については、漢字の文字画像を題材とし、その文字がどのような要素の組み合わせで構成されるかを機械学習の手法を用いて判定する実験を行った。その結果、多クラス分類よりも複数の二クラス分類の方が高精度であること、ストローク単位よりも部首単位のほうが適切な特徴抽出が可能である等の知見が得られた。また、この実験を通して、画像全体の生成モデルを用いなくとも、部分画像の生成モデルを用いて部分画像を学習させることにより漢字全体を認識できる可能性が示された。この手法を発展させることにより、一般的な画像の場合にもその画像を構成する部分領域の学習により画像全体の認識を実現することが可能になると考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
領域分割や画像生成等の要素技術について一定の成果が得られた。一方で、これらを統合したアルゴリズムについての検討はあまり進んでいない。
|
Strategy for Future Research Activity |
本年度検討したいくつかの項目について引き続き検討するとともに、開発した技術を組み合わせることで画像生成モデルを構築する。さらにこれを画像認識に応用する手法について検討する。本年度検討したいくつかの要素技術について引き続き検討するとともに、開発した技術を組み合わせることで画像生成モデルを構築する。さらにこれを画像認識に応用する手法について検討する。
|
Causes of Carryover |
理由:本年度は基本アルゴリズムの開発に注力したために、大量データを用いた大規模な実験までは行えなかった。また、新型コロナウイルス感染症等の影響もあり学会発表が困難であった。 使用計画:実験用の機器の購入、学会発表の旅費、論文投稿の費用や別刷代等に使用予定である。
|
Research Products
(7 results)