Early-Modern Character Recognition with Generated Fonts
Project/Area Number |
22K21307
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
1002:Human informatics, applied informatics and related fields
|
Research Institution | Nara Women's University |
Principal Investigator |
Takemoto Yuki 奈良女子大学, 大学院人間文化総合科学研究科, 博士研究員 (70966712)
|
Project Period (FY) |
2022-08-31 – 2023-03-31
|
Project Status |
Completed (Fiscal Year 2022)
|
Budget Amount *help |
¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
|
Keywords | フォント生成 / 近代書籍 / 文字認識mojininsiki / 文字認識 / ディープラーニング |
Outline of Research at the Start |
本研究では、現代のフォントから自動生成されたフォントを用いて近代書籍の文字認識を行う。文字認識率の向上のためには学習データの充実が不可欠であるが、近代書籍の文字画像は書籍の画像データから収集されている。そのため、入手可能な文字種が限定的である。そこで、近代書籍で用いられるフォントと類似した特徴を持つフォントを自動生成して学習に用いるデータを増やし、近代書籍に対する文字認識精度の向上を目指す。
|
Outline of Final Research Achievements |
The result of this research is to improve the accuracy of Japanese Early-Modern character recognition learning by generated fonts without character images of Early-Modern themselves. It makes up for learning data of Early-Modern character recognition to generate a lot of fonts that have similar features to the target Early Modern character by various character images of modern fonts. In addition, changing a learning parameter enable to vary a balance of features from modern font of input image and the target Early Modern character. This makes various generated fonts from one character image of a modern font and contributes to improve the accuracy of character recognition.
|
Academic Significance and Societal Importance of the Research Achievements |
近代書籍文字認識において、学習データの不足は長年の課題であった。これまで、近代書籍文字の入手方法は書籍の画像データからの切り出しのみである。書籍から入手できる文字画像は文字種に大きな偏りがあり、インクのにじみやかすれが激しい文字画像は学習には利用できない。そのため、必要な全ての文字種の文字画像を十分に収集することは難しい。現代のフォントの文字画像や手書き文字などを学習に利用してみたところ、認識精度の向上には至らなかった。本研究により、学習に利用可能な文字画像が存在しない場合でも、入手が容易な現代のフォントの文字画像から自動生成されたフォントを用いて文字認識を学習することができる。
|
Report
(2 results)
Research Products
(1 results)