2017 Fiscal Year Research-status Report
文字画像データベースを用いたテキスト化に依存しない汎用毛筆画像検索の研究
Project/Area Number |
16K12545
|
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
野本 忠司 国文学研究資料館, 大学共同利用機関等の部局等, 准教授 (20321557)
|
Co-Investigator(Kenkyū-buntansha) |
相田 満 国文学研究資料館, 大学共同利用機関等の部局等, 准教授 (00249921)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 深層学習 / 文字認識 / 日本古典籍 |
Outline of Annual Research Achievements |
(1) 本年度はくずし字認識モデルの先行研究の調査,設計に向けた準備を行った. (2)くずし字の自動認識に関する研究は,まだ取り組みが少なく深層学習の活用も十分ではない.本年度は,いくつかの主要なモデルを実際に実装し,その有効性,効果の実験的確認を中心に行った.(3)PRMUくずし字認識コンテスト(2017)で優勝したモデル(CNN+RNN)をベースに多重アテンション機構 (multi-headed attention),残差ネットワーク(residual networks),位置埋め込み(position embedding)による拡張に取り組んだ.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
調査,モデルの実装,予備実験に予想以上に時間がかかり,やや遅延している.
|
Strategy for Future Research Activity |
アーキテクチャーの見通しがついてきたので,試行実験を繰り返し,ハイパーパラメータの調整,モデルの改良を行う.国文学研究資料館古典籍共同研究事業センター蔵字形データセット,2017PRMUくずし字認識コンテストデータセットを用い,本手法の有効性を検証する.
|
Causes of Carryover |
当初予定していた出張を取りやめたため差額が発生した.次年度の出張費用に転用する.
|