• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

ディープラーニングによるEnd-to-End日本古典籍くずし字認識の研究

研究課題

研究課題/領域番号 19K13085
研究機関大学共同利用機関法人情報・システム研究機構(機構本部施設等)

研究代表者

Clanuwat Tarin  大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (10835177)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードくずし字認識 / 機械学習 / 文字認識
研究実績の概要

研究代表者がKuroNetくずし字認識モデルを開発し、同年度に国際的機械学習コンペKaggle Kuzushiji Recognitionを開催した。それらの成果でIIIF Curation Platformを活用したKuroNetくずし字認識サービスを公開することに成功した。しかし、このサービスはIIIFで公開されていない資料に対応していないため、ユーザーの手持ちの資料をくずし字認識を行えない。本研究の最終目的はくずし字資料の検索システムのプロトタイプを開発することだが、実現するまではさまざまな課題が残っている。
まず、くずし字認識モデルはテストのデータ上で認識精度が95%以上であっても、テストデータと似ていない写本などを翻刻しようとすると精度は十分ではない。なぜなら、KuroNetやKaggleモデルはプロジェクトの概念実証にすぎないのである。そのため、くずし字認識プロジェクトを実世界の資料に適用できるように、機械学習プロジェクトの運用の観点を参考にし、この研究の全体を改良しなければならないことが判明した。研究代表者はさまざまな資料の認識結果のを分析し、モデルの限界、データセットの限界、そしてサービスの限界について、2021年度の情報処理学会、人文科学とコンピュータシンポジウムに論文を投稿した。そして、この研究との連携で、研究代表者はJSTの「ACT-X『AI活用で挑む学問の革新と創成』」に「資料調査のためのオンデバイスくずし字認識」という課題で採択され、誰でもくずし字認識モデルを活用できるサービスとして開発したのがAIくずし字認識アプリ「みを」を開発した。
なお、「みを」アプリは約5万回のダウンロードがあり、2021年度のCode for Japan勝手表彰の優秀賞を受賞した。

  • 研究成果

    (10件)

すべて 2022 2021 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (7件) (うち国際学会 5件、 招待講演 6件) 備考 (2件)

  • [雑誌論文] 資料調査のためのAIくずし字認識スマホアプリ「みを」2021

    • 著者名/発表者名
      カラーヌワット タリン , 北本 朝展
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2021論文集

      巻: 1 ページ: 302-309

    • 査読あり
  • [学会発表] AIによるくずし字認識の研究2022

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Seminar: An Invitation to Digital Humanities: AI, Research Collaboration, Haruki Murakami Library, Waseda University and Digital Transformation,
    • 国際学会 / 招待講演
  • [学会発表] Nissan Seminar: Deciphering pre-modern Japanese manuscripts: kuzushiji recognition systems and AI,2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Oxford School of Global and Area Studies, University of Oxford
    • 国際学会 / 招待講演
  • [学会発表] miwo Kuzushiji recognition smartphone application with AI,2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      The Alan Turing Inistutite
    • 国際学会 / 招待講演
  • [学会発表] AIくずし字認識アプリ「みを」プロジェクトから学んだこと2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Google Cloud Summit
    • 招待講演
  • [学会発表] “miwo” AI Kuzushiji Recognition Application for Japanese Historical Document2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Ritsumeikan University Art Research Center
    • 国際学会 / 招待講演
  • [学会発表] AIくずし字認識アプリ「みを」:機械学習の運用の課題2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      NeurIPS Meetup Japan
    • 国際学会 / 招待講演
  • [学会発表] 資料調査のための AI くずし字認識スマホアプリ「みを」2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      情報処理学会、人文科学とコンピュータシンポジウム
  • [備考] みを(miwo) - AIくずし字認識アプリ

    • URL

      http://codh.rois.ac.jp/miwo/

  • [備考] 浮世絵顔データセット

    • URL

      http://codh.rois.ac.jp/ukiyo-e/face-dataset/index.html

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi