2018 Fiscal Year Annual Research Report
Recognizing Japanese brush script in image
Project/Area Number |
16K12545
|
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
野本 忠司 国文学研究資料館, 研究部, 准教授 (20321557)
|
Co-Investigator(Kenkyū-buntansha) |
相田 満 国文学研究資料館, 研究部, 准教授 (00249921)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 文字画像認識 / 深層学習 / くずし字 |
Outline of Annual Research Achievements |
本年度は二つの文字画像データセットを用い,認識モデルを構築し有効性を検証した.ひとつは,国立情報学研究所人文学オープンデータセンターから公開されているKuzushiji-Kanjiと呼ばれるくずし字画像データ(3,832文字),もうひとつは.KanjiVG(http://kanjivg.tagaini.net/)と呼ばれるベクトルフォントでエンコードされた現代漢字の画像データ(11,457文字)である. 主にサイクルガン(CycleGan)をベースにしたモデルの検討を行った.基本的なアイディアは,現代漢字からくずし字を生成した後,その画像と目標のくずし字の近さに基づいてくずし字の認識を行おうというものである.ベースラインとして単純なクラスタリング(K-Means)を用意して,サイクルガンとの比較を行った.その結果,ベースラインの約70%に対して,サイクルガンは30%程度の性能しか得られないことが確認された.つまり,現状では今回のように対象文字の種類が多い場合,深層学習よりくずし字のサンプルをベースにした画像マッチングの方がより良いパフォーマンスが得られることを示唆する結果となった. 何れにせよ,これまでに用いたデータは基本的に文字単位で切り出された画像を対象にしているため,実際のくずし字認識の適用対象(文書画像)とかなり乖離していると言う問題がある.将来的には今回の結果を踏まえ,すべての個別文字の認識を目指すのではなく,くずし字生成によるキーワードスポッティングなども視野に入れて,検討を進めて行きたい.
|
Research Products
(1 results)