• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

近代書籍からの知の抽出

研究課題

研究課題/領域番号 17H01829
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 図書館情報学・人文社会情報学
研究機関奈良女子大学

研究代表者

城 和貴  奈良女子大学, 生活環境科学系, 教授 (90283928)

研究分担者 高田 雅美  奈良女子大学, 生活環境科学系, 講師 (20397574)
石川 由羽  滋賀大学, データサイエンス教育研究センター, 助教 (20814370)
研究期間 (年度) 2017-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
15,990千円 (直接経費: 12,300千円、間接経費: 3,690千円)
2019年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2018年度: 7,280千円 (直接経費: 5,600千円、間接経費: 1,680千円)
2017年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
キーワード自動テキスト化 / 深層学習 / CNN / レイアウト解析 / 言語翻訳 / デジタルアーカイブ / 文字認識 / テキスト化 / ディープラーニング / 知識処理 / 近代書籍自動テキスト化 / 文語体自動翻訳
研究成果の概要

本研究では四つの成果を得ることができた。まず、2017年度にそれまでの認識手法を統合し、学習データが少ないものの、実用化に近い2,678種の近代書籍文字を9割以上の認識率を記録した。次に学習データを増やすために深層学習を利用して未知の近代書籍文字種を自動生成する手法について2018年度に発表した。さらに2019年度には既存認識手法を一新し、深層学習を利用することで2017年度と同等の性能を示し、さらに転移学習を行うことで、9割程度だった認識率を一気に98%まで引き上げることができた。また、実用化には必須のレイアウト解析にも深層学習を利用できることを示した。

研究成果の学術的意義や社会的意義

近年個人所有のHDD等記憶メディアが劇的に大容量化し、インターネットを介して自由にデータのアクセスが可能になったことから、紙媒体でしか記録が残されていなかった近代書籍等のアーカイブ化が急速に行われている。しかしながら画像でのアーカイブ化では全文検索が不可能であり、現在のような規格が規定されていなかった頃の活版印刷に対応した自動テキスト化技術の確立は急務の課題である。本研究はその技術の確立を目指したもので、現時点で実用化に極めて近いレベルまで研究が進展している。

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実績報告書
  • 2017 実績報告書
  • 研究成果

    (8件)

すべて 2019 2018

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 3件) 学会発表 (4件) (うち国際学会 1件)

  • [雑誌論文] Applying CNNs to Early-Modern Printed Japanese Character Recognition2019

    • 著者名/発表者名
      Suzuka Yasunami, Norie Koiso, Yuki Takemoto, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 雑誌名

      The 2019 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: 1 ページ: 189-195

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Structure of Neural Network Automatically Generating Fonts for Early-Modern Japanese Printed Books2019

    • 著者名/発表者名
      Yuki Takemoto, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 雑誌名

      The 2019 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: 1 ページ: 182-188

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Layout Analysis using Semantic Segmentation for Imperial Meeting Minutes2019

    • 著者名/発表者名
      Sayaka Iida, Yuki Takemoto, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 雑誌名

      The 2019 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: 1 ページ: 135-141

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Automatic Font Generation for Early-Modern Japanese Printed Books2018

    • 著者名/発表者名
      Yuki Takemoto, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 雑誌名

      The 2018 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: On-site Edition ページ: 326-332

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [学会発表] 近代書籍における低出現頻度文字種の獲得2019

    • 著者名/発表者名
      藤田未希, 竹本有紀, 石川由羽, 髙田雅美, 城和貴
    • 学会等名
      情報処理学会数理モデル化と問題解決研究会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 帝国議会会議録におけるレイアウト解析手法の比較2018

    • 著者名/発表者名
      飯田 紗也香,竹本 有紀,石川 由羽,高田 雅美,城 和貴
    • 学会等名
      情報処理学会数理モデル化と問題解決研究会
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 近代文語体と現代口語体の自動翻訳への試み2018

    • 著者名/発表者名
      林 英里香,竹本 有紀,石川 由羽,高田 雅美,城 和貴
    • 学会等名
      情報処理学会数理モデル化と問題解決研究会
    • 関連する報告書
      2018 実績報告書
  • [学会発表] Automatic Font Generation For Early-Modern Japanese Printed Books2018

    • 著者名/発表者名
      Yuki Takemoto
    • 学会等名
      International Conference on Paralel and Distributed Systems and Applications 2018
    • 関連する報告書
      2017 実績報告書
    • 国際学会

URL: 

公開日: 2017-04-28   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi