• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

拓本の時空間データベースの作成及び潜在的知識の発見

研究課題

研究課題/領域番号 18K18337
研究機関立命館大学

研究代表者

孟 林  立命館大学, 理工学部, 准教授 (60615938)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード時空間データベース / 拓本 / 深層学習
研究実績の概要

1)学習データの再構築:最初、既存の拓本文字データベースを用いた深層学習での拓本文字の認識実験では、思った通りの認識精度が達成できなかった。分析により、拓本文字データベースには複数のミスが存在していることが分かった。つまり、データベースにミスが生じ、深層学習の学習データが汚染されることにより、認識精度が低下した。従って、我々は既存のデータベースのミスを無くし、学習データセットの再構築をした。それにより、認識精度をある程度向上させた。
2)深層学習認識の限界と対策:認識結果分析において、深層学習において拓本文字認識精度の限界が見えつつあることが分かった。その理由としては、拓本の欠損と文字の劣化である。そのため、我々は深層学習とビックデータ解析技術の二つの手法を組み合わせて、文字を予測することにより、更なる拓本文字認識の精度の向上を実現してきた。その結果として数パーセントの認識向上を達成できた。
3)時空間データベースの雛形と認識システムのオンラインAPIの雛形:今年度では、時空間データベースの雛形を作成し、これから機能の拡張を行う予定である。また、既に、漢字認識システムのオンラインAPIを作成した。主に、拓本の一部である甲骨文字と漢字を含めたくずし字である。システムは、研究室のサーバに組み込んでオンライン使用が可能となる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

深層学習を用いた拓本文字の認識を目指しているが、データセットが非常に重要である。既存のデータセットを用いた深層学習による拓本文字の認識評価では、認識率がなかなか向上できず、非常に鮮明な文字が認識できないという問題が生じてしまった。詳細に分析すると、従来のデータセットのミス問題、データセットの質の問題非常に大きいことが分かった。
データセットの質の問題は、データセットの非常に不鮮明な画像の存在とデータセットのアンバランスという問題が含まれている。そのため、我々は、学習データセットを再構築し、非常に時間と労力を費やしてしまった。しかし、より正確かつ有効な拓本認識用のデータセットの構築ができた。今後の研究につながると考えられる。
これまでに、拓本の一部である甲骨文字と漢字を含めたくずし字のオンライン認識APIを作成した。しかし、APIにおいては、複数の深層学習モデルとCPUサーバの使用により、認識速度が大きな問題となることが分かった。今後の認識において、認識速度が一つの課題となることが分かった。

今後の研究の推進方策

今後の推進方策は以下となる。
1)複数の拓本を用いて、認識システムの有効性を更に確認し、問題点を解決する。そして、モデルをオンラインにアップロードし、認識システムの実用化を図る。
2)時空間データベースの構築に力を入れて、その完成を目指す。そして、オンラインのAPIを実現し、実用化を図る。
3)現在拓本の一部である甲骨文字と漢字を含めたくずし字のオンライン認識APIは、複数の深層学習モデルを有するが、CPUサーバの使用により、一文字の認識にあたって、十秒から数十秒をかかり、認識速度が大きな問題となることが分かった。今後は認識精度の向上とともに、認識速度の向上にも視野に入れる。

次年度使用額が生じた理由

2020年度にデータセットの作成・実験結果の分析のための人件費および認識速度問題を緩和するため高性能サーバを購入する費用が必要となり、そのために2019年度の支出を調整し、削減したために次年度使用が生じた。

  • 研究成果

    (13件)

すべて 2019 その他

すべて 国際共同研究 (2件) 学会発表 (10件) (うち国際学会 9件、 招待講演 1件) 備考 (1件)

  • [国際共同研究] N.M.A.M. Insitute of Technology, NITTE(インド)

    • 国名
      インド
    • 外国機関名
      N.M.A.M. Insitute of Technology, NITTE
  • [国際共同研究] 中国安陽師範学院甲骨文処理教育部重点実験室(中国)

    • 国名
      中国
    • 外国機関名
      中国安陽師範学院甲骨文処理教育部重点実験室
  • [学会発表] Culture Heritage Protection based on Artificial Intelligence2019

    • 著者名/発表者名
      Lin Meng
    • 学会等名
      第九回全国(中国)文字と計算機学術研討会
    • 招待講演
  • [学会発表] Deep Learning and Lexical Analysis Combined Rubbing Character Recognition2019

    • 著者名/発表者名
      Zhiyu Zhang, Zhichen Wang, Hiroyuki Tomiyama, and Lin Meng
    • 学会等名
      2019 International Conference on Advanced Mechatronic Systems (ICAMechS 2019)
    • 国際学会
  • [学会発表] A Method of Japanese Ancient Text Recognition by Deep Learning2019

    • 著者名/発表者名
      Lehan Chen, Bing Lyu, Hiroyuki Tomiyama and Lin Meng
    • 学会等名
      International Conference on Identification, Information and Knowledge in the Internet of Things (IIKI)
    • 国際学会
  • [学会発表] Rubbing Characters Recognition based on Deep Learning and Lexical Analysis2019

    • 著者名/発表者名
      Zhiyu Zhang, Yuxi Chen, Hiroyuki Tomiyama and Lin Meng
    • 学会等名
      Ninth Annual Conference of Japanese Association for Digital Humanities
    • 国際学会
  • [学会発表] Deep Learning based Japanese Early Books Understanding2019

    • 著者名/発表者名
      Bing Lyu, Hiroyuki Tomiyama and Lin Meng
    • 学会等名
      Ninth Annual Conference of Japanese Association for Digital Humanities
    • 国際学会
  • [学会発表] Deep Learning based Ancient Literature Recognition and Preservation2019

    • 著者名/発表者名
      Lin Meng
    • 学会等名
      the SICE Annual Conference International Conference
    • 国際学会
  • [学会発表] Oracle Bone Inscription Detector Based on SSD2019

    • 著者名/発表者名
      Lin Meng, Bing Lyu, Zhiyu Zhang, C.V. Aravinda, Naoto Kamitoku, Katsuhiro Yamazaki
    • 学会等名
      International Workshop on Pattern Recognition for Cultural Heritage(PatReCH 2019), in conjunction with ICIAP2019
    • 国際学会
  • [学会発表] The Early Japanese Books Text Line Segmentation base on Image Processing and Deep Learning2019

    • 著者名/発表者名
      Bing Lyu, Ryo Akama, Hiroyuki Tomiyama, and Lin Meng
    • 学会等名
      The 2019 International Conference on Advanced Mechatronic Systems
    • 国際学会
  • [学会発表] Combining Deep Learning and Lexical Analysis method for Rubbing Character Recognition2019

    • 著者名/発表者名
      Zhiyu Zhang, Hiroyuki Tomiyama, Lin Meng
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 国際学会
  • [学会発表] ARU-NetとLeNetを用いた日本古典籍の自動解読2019

    • 著者名/発表者名
      呂氷, 冨山宏之, 孟林
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 国際学会
  • [備考] 甲骨文字(拓本)・くずし字認識システム

    • URL

      http://www.atait.se.ritsumei.ac.jp/CharacterRecognition/

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi