• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 研究成果報告書

クラウドソーシングと機械学習を統合した歴史資料翻刻システムの開発

研究課題

  • PDF
研究課題/領域番号 18K18338
研究種目

若手研究

配分区分基金
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関国立歴史民俗博物館

研究代表者

橋本 雄太  国立歴史民俗博物館, 大学共同利用機関等の部局等, 助教 (10802712)

研究期間 (年度) 2018-04-01 – 2020-03-31
キーワードクラウドソーシング / 翻刻 / IIIF / くずし字 / 歴史資料 / 文字認識
研究成果の概要

本研究は、文字認識技術とクラウドソーシングによる人海戦術を統合することで、日本語の歴史文献資料を効率的にテキスト化する手法を開発することであった。当初は本研究で文字認識技術の開発に取り組む予定であったが、「くずし字」の自動認識技術が急速に発展したことを踏まえて方針を転換し、文字認識研究者と協業して翻刻プラットフォームの開発にあたった。
その成果として、AI文字認識に対応した翻刻プラットフォーム「みんなで翻刻」を2019年7月に公開した。2020年4月までに「みんなで翻刻」では、約800人の参加者により250万字以上の歴史資料が翻刻されるという成果を挙げている。

自由記述の分野

人文情報学

研究成果の学術的意義や社会的意義

AI認識に対応した「みんなで翻刻」は、300日の短期間で250万字ものテキスト化を成し遂げた。本研究成果の直接的な意義のひとつは、AIの支援を通じて市民による翻刻作業の効率化が実際に可能であることを実際に示したことにある。
より大きな観点での成果は、技術の適切な組み合わせによって、①人文学研究者、②市民、③AI技術(およびその研究者)の三者が互恵的な関係を築くことが可能であると示したことにある。AI技術の発展が人文学研究と市民参加型研究の将来にもたらす影響について、これまで様々な議論がなされてきたが、本研究の成果は重要な参考事例のひとつになるはずである。

URL: 

公開日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi