• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Annual Research Report

アジア文化圏の古文書アーカイビングのための基盤構築

Research Project

Project/Area Number 24300095
Research InstitutionTokyo University of Agriculture and Technology

Principal Investigator

中川 正樹  東京農工大学, 工学(系)研究科(研究院), 教授 (10126295)

Co-Investigator(Kenkyū-buntansha) 朱 碧蘭  東京農工大学, 工学(系)研究科(研究院), 助教 (50466918)
斎藤 隆文  東京農工大学, 工学(系)研究科(研究院), 教授 (60293007)
堀田 政二  東京農工大学, 工学(系)研究科(研究院), 准教授 (90346932)
Project Period (FY) 2012-04-01 – 2016-03-31
Keywords古文書 / アーカイブ / 画像処理 / 言語処理 / 文字認識
Outline of Annual Research Achievements

本研究では,研究期間内に次の4つの項目を達成することを目標にしている.(1)媒体に特有な画像処理方式の確立とライブラリ化 アジア文化圏においては,紙以前は木簡,竹簡などに墨で筆記されていることが多い.これらの媒体に特有な劣化,汚損・破損に対応できる画像処理技術を確立する.(2)言語に共通な文書解析手法の確立とライブラリ化 多字種,分かち書きなし,縦書き横書き混在,などに対応した手法を言語独立に確立する.(3)言語依存の文字認識と文書解析の確立とライブラリ化 言語共通にメタなシステムを提供し,個々の言語ごとに学習パターンから認識システムを構築できる戦略をとる.そのための方式やツールを確立する.(4)上記機能によるタグ付けと手書きアノテーション機能の確立
古文書のディジタルアーカイブには,発掘や採集情報のほかに,文書や文字にコードを割り振るタグ付けとアノテーションの付与が必須である.初年度には,古文書に見られる黒ずみやくすみなどを除去するノイズ除去,そして,文書からの行切り出し・文字切り出しの手法を研究し,そのプロトタイプを作成した.本年度は,その改良に加えて, ベトナムのチュノム文書を解読するために,4万字種にも及ぶチュノム文字認識システムのプロトタイプを作成した.また,奈良平城京などから出土する木簡を対象に,アノテーションツールを開発した.このアノテーションツールは,奈良文化財研究所で試用に供している.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

昨年度に作成した チュノム文字認識システムのプロトタイプを改良した.また,奈良平城京などから出土する木簡を対象にしたアノテーションツールの バージョンアップを行った.このアノテーションツールは,奈良文化財研究所で使用に供している.さらに,出土するのは原 型をとどめる木簡だけでなく,大量の削りくずが含まれており,これらを組みわせてみる方式を研究した.以上の成果を国 際会議で発表し,国際学術誌に論文投稿した.また,国内での研究会でも発表した.

Strategy for Future Research Activity

本年度は,昨年に引き続き,方式やシステムにス パイラル法を適用し,各手法の完成度を高め,ライブラリを更新していく.そして,言語依存の部分とそうでない部分をできる限り分離する. さらに,ベトナムのチュノム文書の解読のために開発したベト ナム古文書のOCRをWebベー スで公開する準備を進める.古文書を 受信し,それを解読して結果を返すシステムに発展させたいと考えている.奈良平城京か ら出土する削りくずの組合せのためには,色や木目の基づいたクラスタリングを適用し,そのうえで,ジグソーパズルのように遊び感覚で組み 合わせて見られるゲームを作成し,公開したいと考えている.さらに,次 のことを他機関や他大学と連携して研究開発することを検討する.

Remarks

研究室HP http://www.tuat.ac.jp/~nakagawa/

  • Research Products

    (5 results)

All 2014

All Presentation (5 results)

  • [Presentation] 失われた言語チュノムによる古文書の完全電子化に向けて2014

    • Author(s)
      中川正樹,Phan Van Truyen
    • Organizer
      日本情報考古学会
    • Place of Presentation
      東京農工大学(東京都小金井市)
    • Year and Date
      2014-09-27 – 2014-09-28
  • [Presentation] Text/Non-Text Classification in Online Handwritten Documents with Recurrent Neural Networks2014

    • Author(s)
      Truyen Van Phan, and Masaki Nakagawa
    • Organizer
      he 14th International Conference on Frontiers in Handwriting Recognition (ICFHR2014)
    • Place of Presentation
      Crete, Greece
    • Year and Date
      2014-09-01 – 2014-09-04
  • [Presentation] A semi-incremental recognition method for online handwritten English text2014

    • Author(s)
      Cuong Tuan Nguyen, Bilan Zhu and Masaki Nakagawa
    • Organizer
      the 14th International Conference on Frontiers in Handwriting Recognition (ICFHR2014)
    • Place of Presentation
      Crete, Greece
    • Year and Date
      2014-09-01 – 2014-09-04
  • [Presentation] Construction of a Text Digitization System for Nôm Historical Documents2014

    • Author(s)
      Truyen Van Phan, and Masaki Nakagawa
    • Organizer
      the International Conference on Digital Access to Textual Cultural Heritage (DATeCH2014)
    • Place of Presentation
      Madrid, Spain
    • Year and Date
      2014-05-19 – 2014-05-20
  • [Presentation] A System for Recognizing Online Handwritten Mathematical Expressions and Improvement of Structure Analysis2014

    • Author(s)
      Anh Duc LE, Truyen Van PHAN, and Masaki NAKAGAWA
    • Organizer
      the 11th IAPR International Workshop on Document Analysis Systems (DAS 2014)
    • Place of Presentation
      Tours, France
    • Year and Date
      2014-04-07 – 2014-04-10

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi