• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

クラウドソーシングと機械学習を統合した歴史資料翻刻システムの開発

研究課題

研究課題/領域番号 18K18338
研究種目

若手研究

配分区分基金
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関国立歴史民俗博物館

研究代表者

橋本 雄太  国立歴史民俗博物館, 大学共同利用機関等の部局等, 助教 (10802712)

研究期間 (年度) 2018-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2019年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワードクラウドソーシング / 翻刻 / IIIF / くずし字 / 歴史資料 / 文字認識 / OCR / 機械学習 / 古典籍 / 古文書
研究成果の概要

本研究は、文字認識技術とクラウドソーシングによる人海戦術を統合することで、日本語の歴史文献資料を効率的にテキスト化する手法を開発することであった。当初は本研究で文字認識技術の開発に取り組む予定であったが、「くずし字」の自動認識技術が急速に発展したことを踏まえて方針を転換し、文字認識研究者と協業して翻刻プラットフォームの開発にあたった。
その成果として、AI文字認識に対応した翻刻プラットフォーム「みんなで翻刻」を2019年7月に公開した。2020年4月までに「みんなで翻刻」では、約800人の参加者により250万字以上の歴史資料が翻刻されるという成果を挙げている。

研究成果の学術的意義や社会的意義

AI認識に対応した「みんなで翻刻」は、300日の短期間で250万字ものテキスト化を成し遂げた。本研究成果の直接的な意義のひとつは、AIの支援を通じて市民による翻刻作業の効率化が実際に可能であることを実際に示したことにある。
より大きな観点での成果は、技術の適切な組み合わせによって、①人文学研究者、②市民、③AI技術(およびその研究者)の三者が互恵的な関係を築くことが可能であると示したことにある。AI技術の発展が人文学研究と市民参加型研究の将来にもたらす影響について、これまで様々な議論がなされてきたが、本研究の成果は重要な参考事例のひとつになるはずである。

報告書

(3件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 研究成果

    (6件)

すべて 2019 2018 その他

すべて 学会発表 (4件) (うち国際学会 3件、 招待講演 1件) 図書 (1件) 備考 (1件)

  • [学会発表] Digital Humanities Research in National Museum of Japanese History2019

    • 著者名/発表者名
      Yuta Hashimoto
    • 学会等名
      The International Conference for Museums of Language & Writing 2019
    • 関連する報告書
      2019 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] Honkoku2: Towards a Large-scale Transcription of Pre-modern Japanese Manuscripts2019

    • 著者名/発表者名
      Yuta Hashimoto
    • 学会等名
      The 9th Conference of Japanese Association for Digital Humanities (JADH2019)
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Minna De Honkoku: Learning-Driven Crowdsourced Transcription Of Pre-Modern Japanese Earthquake Records2018

    • 著者名/発表者名
      Yuta Hashimoto, et al.
    • 学会等名
      Digital Humanities 2018
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] 日本語文献史料の構造化記述のための軽量マークアップ言語の開発2018

    • 著者名/発表者名
      橋本雄太, 宮川真弥
    • 学会等名
      人文科学とコンピューターシンポジウム2018
    • 関連する報告書
      2018 実施状況報告書
  • [図書] デジタルアーカイブ・ベーシックス22019

    • 著者名/発表者名
      今村文彦 監修/鈴木親彦 責任編集
    • 総ページ数
      208
    • 出版者
      勉誠出版
    • ISBN
      9784585202820
    • 関連する報告書
      2019 実績報告書
  • [備考] みんなで翻刻

    • URL

      https://honkoku.org/

    • 関連する報告書
      2019 実績報告書

URL: 

公開日: 2018-04-23   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi