• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

近代デジタルライブラリの自動テキスト化

Research Project

Project/Area Number 21500237
Research InstitutionNara Women's University

Principal Investigator

城 和貴  Nara Women's University, 大学院・人間文化研究科, 教授 (90283928)

Co-Investigator(Kenkyū-buntansha) 高田 雅美  奈良女子大学, 大学院・人間文化研究科, 助教 (20397574)
Keywords近代書籍デジタル化 / 文字認識 / アーカイブ / 自動テキスト化 / サポートベクタマシン / 画像処理
Research Abstract

国立国会図書館近代デジタルライブラリから出版時期出版元の異なる10タイトルを選出し、50種類の活字を人手で切り取り初期データを構築した。構築されたデータセットをもとに学習用データベースを構築した。同時に方向寄与度特徴ならびにサポートベクタマシンの実装を行い、構築された学習データベースで学習を行い、本提案手法が有効であることを示した。以上の研究成果を国際会議で口頭発表を行い、同国際会議論文集に論文を掲載した。これら予備評価実験の後、活字切り出し手法の検討を行い、実装を行った。学習用データベースを充実し、本番の学習で使えるようにデータを増やすために、8TBのRaid5を整備した。さらに、本認識システムで対応できない誤認識文字への対応として、近代デジタルライブラリ・ポータルの設計に着手した。本ポータルでは、元画像とテキスト化された画面を表示させて、閲覧者が誤認識を修正できるものであり、その結果がさらに認識システムの学習を改善させるものである。

  • Research Products

    (1 results)

All 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results)

  • [Journal Article] Recognition of Multi-Fonts Character in Early-Modern Printed Books2009

    • Author(s)
      C.Ishikawa, N.Ashida, Y.Enomoto, M.Takata, T.Kimesawa, K.Joe
    • Journal Title

      The 2009 International Conference on Parallel and Distributed Processing Techniques and Applications 2

      Pages: 728-734

    • Peer Reviewed

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi