• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Low-cost and Automatic Linked Data Conversion for Machine-readable Bibliographies of Cultural Properties

Research Project

Project/Area Number 19K20630
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionSaga University

Principal Investigator

Natsuko Yoshiga  佐賀大学, 地域学歴史文化研究センター, 研究機関研究員 (70457498)

Project Period (FY) 2019-04-01 – 2022-03-31
Project Status Completed (Fiscal Year 2021)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2019: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Keywords江戸期古記録 / シチズンサイエンス / 深層学習 / 固有表現抽出 / 単語分散表現 / 機械可読化 / 市民科学 / 形態素解析 / ディープラーニング / 候文 / Linked Data / クラウドソーシング / シビックテック / 機械可読
Outline of Research at the Start

従来の文化財あるいは歴史資料を対象とする人文系デジタルアーカイブの構築は、史料原本の破損や劣化の防止、情報整理が主目的であった。近年、そのようなアーカイブの役割は、通信・ハードウェア性能とソフトウェア技術両面の向上と、社会の課題をデータを用いて解決する、データ駆動型社会の推進で大きく変容している。本研究は、江戸時代に記された「小城鍋島日記目録」書誌を一例として、定量分析や外部知識へのアクセスが容易となるLinked Data形式の書誌データに低コストで変換するために、従来より一層高精度で、 個人負担の少ない手法をクラウドソーシングとディープラーニング技術を用いて確立するものである。

Outline of Final Research Achievements

In order to understand the contents of the many historical records that have survived in the local area, it is essential to have the expertise to read and understand the handwritten, kuzushiji documents in the literary language of the era. Currently, there are only a few people with such expertise, and this is a major barrier to analyzing local history and culture. In this study, we developed a method to mechanically extract unique expressions (keywords) such as names of people, events, and places from reprinted texts as much as possible, which can be the key to deciphering the text. In the first half of the study, we asked citizens who were originally interested in local materials to extract local-specific expressions that could not be found on the Internet from the perspective of citizen science. In the second half of the research, we established a method to extract unique expressions with high accuracy by using deep learning methods based on the manual extraction results.

Academic Significance and Societal Importance of the Research Achievements

近年、我々の身の回りで起きる出来事をデータ化し、社会課題の解決に活かすデータ駆動型社会への移行が加速している。郷土の歴史資料においても同様に単なる画像への電子化に留まらず、テキスト化・機械可読化することが、人手に余る大量の資料の解析に必要であるとの認識が高まっている。本研究では、地域の歴史を知り守りたいと思う市民の助けと機械学習の力で歴史資料を低コストに機械可読化する手法を確立した。さらに、従来のデジタルアーカイブにおけるデータ提供者と利用者の役割を超えて関係者全員が文化財データを構築していく市民科学の実践にも貢献した。

Report

(4 results)
  • 2021 Annual Research Report   Final Research Report ( PDF )
  • 2020 Research-status Report
  • 2019 Research-status Report
  • Research Products

    (10 results)

All 2022 2021 2020 2019 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (3 results) (of which Invited: 2 results) Book (1 results) Remarks (3 results)

  • [Journal Article] Named Entities Extraction by Citizen Participation and Machine Learning for Making Machine-readable Old Records of the Edo Period Remaining in Local Communities2022

    • Author(s)
      吉賀 夏子、堀 良彰、只木 進一、永崎 研宣、伊藤 昭弘
    • Journal Title

      情報処理学会論文誌

      Volume: 63 Issue: 2 Pages: 310-323

    • DOI

      10.20729/00216238

    • NAID

      170000187563

    • Year and Date
      2022-02-15
    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 地域市民と創出する文化財データ2020

    • Author(s)
      吉賀 夏子
    • Journal Title

      考古学ジャーナル

      Volume: 736 Pages: 27-28

    • Related Report
      2019 Research-status Report
    • Peer Reviewed
  • [Journal Article] 低コストなLinked Data化を目指したクラウドソーシングによる固有表現収集の試み2019

    • Author(s)
      吉賀 夏子, 只木 進一
    • Journal Title

      じんもんこん2019論文集

      Volume: 2019 Pages: 239-244

    • NAID

      170000180929

    • Related Report
      2019 Research-status Report
    • Peer Reviewed
  • [Presentation] 候文における文字単位の単語分散表現モデルに基づく固有表現抽出手法2021

    • Author(s)
      吉賀 夏子, 堀 良彰, 永崎 研宣
    • Organizer
      研究報告人文科学とコンピュータ(CH)
    • Related Report
      2020 Research-status Report
  • [Presentation] 小城藩日記プロジェクトの紹介2020

    • Author(s)
      吉賀夏子
    • Organizer
      第122回人文学とコンピュータ研究会(情報処理学会)/第13回地域学シンポジウム
    • Related Report
      2019 Research-status Report
    • Invited
  • [Presentation] 低コストな文化財書誌の機械可読化を目指して2019

    • Author(s)
      吉賀夏子
    • Organizer
      人文学とコンピュータシンポジウム2019 企画セッション「若手研究者によるCH/人文情報学」
    • Related Report
      2019 Research-status Report
    • Invited
  • [Book] Japanese and Asian Historical Research in the Digital Age2021

    • Author(s)
      The National Museum of Japanese History Makoto Goto, Satoru Nakamura, Chifumi Nishioka, Arianti Ayu Puspita, Taizo Yamada, Yuta Hashimoto, Natsuko Yoshiga, Tatsuki Sekino, Naoki Kokaze, and Shohei Yamasaki
    • Total Pages
      216
    • Publisher
      University of Michigan Press
    • ISBN
      9781607855118
    • Related Report
      2020 Research-status Report
  • [Remarks] 小城藩日記データベース

    • URL

      https://crch.dl.saga-u.ac.jp/nikki/

    • Related Report
      2021 Annual Research Report
  • [Remarks] 小城藩日記プロジェクト - UDC2019 NO.188

    • URL

      https://winter.ai.is.saga-u.ac.jp/udc2019/

    • Related Report
      2019 Research-status Report
  • [Remarks] 小城藩日記データベース

    • URL

      https://www.dl.saga-u.ac.jp/ogiNikki/

    • Related Report
      2019 Research-status Report

URL: 

Published: 2019-04-18   Modified: 2023-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi