• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Early-Modern Character Recognition with Generated Fonts

Research Project

Project/Area Number 22K21307
Research Category

Grant-in-Aid for Research Activity Start-up

Allocation TypeMulti-year Fund
Review Section 1002:Human informatics, applied informatics and related fields
Research InstitutionNara Women's University

Principal Investigator

Takemoto Yuki  奈良女子大学, 大学院人間文化総合科学研究科, 博士研究員 (70966712)

Project Period (FY) 2022-08-31 – 2023-03-31
Project Status Completed (Fiscal Year 2022)
Budget Amount *help
¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywordsフォント生成 / 近代書籍 / 文字認識mojininsiki / 文字認識 / ディープラーニング
Outline of Research at the Start

本研究では、現代のフォントから自動生成されたフォントを用いて近代書籍の文字認識を行う。文字認識率の向上のためには学習データの充実が不可欠であるが、近代書籍の文字画像は書籍の画像データから収集されている。そのため、入手可能な文字種が限定的である。そこで、近代書籍で用いられるフォントと類似した特徴を持つフォントを自動生成して学習に用いるデータを増やし、近代書籍に対する文字認識精度の向上を目指す。

Outline of Final Research Achievements

The result of this research is to improve the accuracy of Japanese Early-Modern character recognition learning by generated fonts without character images of Early-Modern themselves. It makes up for learning data of Early-Modern character recognition to generate a lot of fonts that have similar features to the target Early Modern character by various character images of modern fonts. In addition, changing a learning parameter enable to vary a balance of features from modern font of input image and the target Early Modern character. This makes various generated fonts from one character image of a modern font and contributes to improve the accuracy of character recognition.

Academic Significance and Societal Importance of the Research Achievements

近代書籍文字認識において、学習データの不足は長年の課題であった。これまで、近代書籍文字の入手方法は書籍の画像データからの切り出しのみである。書籍から入手できる文字画像は文字種に大きな偏りがあり、インクのにじみやかすれが激しい文字画像は学習には利用できない。そのため、必要な全ての文字種の文字画像を十分に収集することは難しい。現代のフォントの文字画像や手書き文字などを学習に利用してみたところ、認識精度の向上には至らなかった。本研究により、学習に利用可能な文字画像が存在しない場合でも、入手が容易な現代のフォントの文字画像から自動生成されたフォントを用いて文字認識を学習することができる。

Report

(2 results)
  • 2022 Annual Research Report   Final Research Report ( PDF )
  • Research Products

    (1 results)

All 2023

All Presentation (1 results)

  • [Presentation] 自動生成フォントを用いた近代書籍文字認識2023

    • Author(s)
      竹本有紀、石川由羽、高田雅美、城和貴
    • Organizer
      第142回 数理モデル化と問題解決(MPS)研究会
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-09-01   Modified: 2024-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi