• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

拓本の時空間データベースの作成及び潜在的知識の発見

研究課題

研究課題/領域番号 18K18337
研究機関立命館大学

研究代表者

孟 林  立命館大学, 理工学部, 講師 (60615938)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード拓本時空間データベース / 深層学習
研究実績の概要

本研究では、漢字を中心とした日本と中国の重要な古資料文献である拓本の多書体文字を、深層学習を用いて認識し、さらに、時空間情報を含むデータベースを作成して、それらを地図上に可視化することで有用な情報を抽出し、歴史の整理、気候変動、自然災害の予測対応等の研究に貢献することを目的とする。
現在、拓本内の多書体文字を認識するためのデータ増強、データセット作成手法、深層学習による認識と認識率の向上手法を提案し、実験を行ってきた。また、拓本の時空間情報をキーワード毎に整理して時空間データベースを作成し、それらを地図上に可視化して潜在知識を抽出する、拓本潜在知識発見システムを設計している。
拓本内の多書体文字の認識では、集めてきた拓本内の文字に対して、ノイズの除去、切り取り、輝度値変更の処理を行い、訓練データを増強し、100文字種5267331枚の画像を生成した。また、AlexnetとGoogLenetを用いて学習、認識を行い、61文字種のときGoogLenetで認識率96%、100文字種のときAlexnetで認識率92%を達成することを示した。さらに、AlexnetのDropoutの値を変更することで、認識率を92%から93.5%まで向上することを示した。
時空間データベースの作成と可視化では、拓本の時空間情報を整理して、時空間管理番号表を作成し、さらに、キーワード毎に拓本の情報を管理番号でまとめた、キーワード管理番号表を12文字分作成した。そして、それら2つのリストを用いて、時空間データベースを作成するプログラムと、時空間データベースから地図上に可視化するのに必要な情報を整理するシステムを実現した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

新たに発見した問題点
(1)拓本の欠損により、深層学習においても認識できない部分が存在している。
(2)歴史の原因により、拓本の出土地域と出土時間を記載されていない拓本が存在していることが分かった。それにより、当該する拓本情報を時間空間データベースに記録できない問題が生じる。
(3)研究推進することにより、拓本のみならず、本研究は、日本の古典籍の認識と整理にも使えると発見した。

今後の研究の推進方策

今年度の研究計画は、当初設定されたプロセスの進行と、新たに発見された問題点の解決の二つで構成されている。
【設定されたプロセス】
(1)深層学習と画像処理を用いて、拓本文字認識精度の向上を目指す。
(2)時空間データベースを完成する。(3)画像処理を用いてキーワードの可視化を実現する。
【新たに発見された問題点】
(1)拓本欠損問題について:拓本の欠損による認識できない拓本文に対して、統計的な手法を用いて、認識できた部分を整理し、認識できない拓本文の推測を行う。(2)拓本情報の不足問題について:インタネットでの検索、海外の研究者を含めた専門に聞く、そして、認識できた拓本の文章から、必要な拓本に関する情報を分析し、取得する。(3)日本古典籍への応用について、本研究は日本古典籍への応用ができると判明し、今後本システムを用いて、日本古典籍のキーワードに関する時間空間データベースを作成し、日本古典籍から潜在的な知識の抽出に貢献したい。

  • 研究成果

    (8件)

すべて 2019 2018

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (7件) (うち国際学会 3件、 招待講演 2件)

  • [雑誌論文] ハフ空間での依存マトリクスを用いた主線分抽出による甲骨文字認識2018

    • 著者名/発表者名
      孟 林,辻 翼,泉 知論, 落合 淳思,山崎 勝弘
    • 雑誌名

      画像電子学会誌

      巻: 47 ページ: 457-466

    • 査読あり
  • [学会発表] 画像処理と深層学習を用いた古代文献の解読と整理2019

    • 著者名/発表者名
      孟 林
    • 学会等名
      電気学会、制御研究会
  • [学会発表] 甲骨拓本からの自動文字抽出手法と支援環境2019

    • 著者名/発表者名
      渡邉 清威, 孟 林, 泉 知論
    • 学会等名
      画像電子学会 第288回研究会
  • [学会発表] Unlocking Potential Knowledge Hidden in Rubbing:Multi-style Character Recognition using Deep Learning and Spatiotemporal Rubbing Database Creation2018

    • 著者名/発表者名
      Lin Meng, Masahiro Kishi, Kana Nogami, Michiko Nabeya and Katsuhiro Yamazaki
    • 学会等名
      EuroMed2018 7th International Conference on DIGITAL HERITAGE
    • 国際学会
  • [学会発表] Ancient Asian Character Recognition for Literature Preservation and Understanding2018

    • 著者名/発表者名
      Lin Meng, C.V Aravinda, K R Uday Kumar Reddy, Tomonori Izumi and Katsuhiro Yamazaki
    • 学会等名
      EuroMed2018 7th International Conference on DIGITAL HERITAGE
    • 国際学会
  • [学会発表] Recognition of Oracle Bone Inscriptions Using Deep Learning based on Data Augmentation2018

    • 著者名/発表者名
      Lin Meng, Naoki Kamitoku and Katsuhiro Yamazaki
    • 学会等名
      2018 IEEE International Conference on Metrology for Archaeology and Cultural Heritage (IEEE MetroArchaeo 2018)
    • 国際学会
  • [学会発表] Artificial Intelligence for Computer Science and Image Recognition2018

    • 著者名/発表者名
      Lin Meng
    • 学会等名
      ICETE-2018 (International Conference on Emerging Trends in Engineering)
    • 招待講演
  • [学会発表] Oracle Bone Inscriptions Recognition by Image Processing and Deep Learning2018

    • 著者名/発表者名
      Lin Meng
    • 学会等名
      the 1st Int. Symp. On Oracle Bone Inscriptions Information Processing
    • 招待講演

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi