• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ディープラーニングによるEnd-to-End日本古典籍くずし字認識の研究

研究課題

研究課題/領域番号 19K13085
研究種目

若手研究

配分区分基金
審査区分 小区分02010:日本文学関連
研究機関大学共同利用機関法人情報・システム研究機構(機構本部施設等)

研究代表者

Clanuwat Tarin  大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (10835177)

研究期間 (年度) 2019-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワードくずし字 / 機械学習 / 文字認識 / 古典籍 / 日本文学 / くずし字認識 / コンペティション / 翻刻
研究開始時の研究の概要

本研究はディープラーニングによる、くずし字認識システム、サービスを開発する研究である。応募者が中間手順が不要の新しい手法を提案し、モデルを開発した。この手法は生物医療分野の細胞画像で領域検出に成功しており、実験を行ったところ、精度が70%~93%までたどり着いた。さらに、2019年に人文学オープンデータ共同利用センター(CODH)が主催する、くずし字認識国際コンペティションの参加者からアルゴリズムアイディアを取り入れてくずし字認識モデルを改善し、CODHの所持している日本古典籍データセットを翻刻して一般公開する。さらに、くずし字に関するさまざまなサービスを公開する。

研究成果の概要

本研究は機械学習によるくずし字認識の研究であり、研究代表者はくずし字認識モデルKuroNetを開発し、認識精度が90%に達した。KuroNetの特徴は典型的な文字認識の処理順を逆転させ、難易度が高いレイアウト解析を後に回して文字認識を先に行うという方法である。そして、2019年に国際的AIコンペKaggle Kuzushiji Recognitionを開催した。このコンペの問題設定やデータ準備の作業に対してKuroNetは不可欠だった。さらに、IIIF KuroNetくずし字認識サービスが公開された。最後にKuroNetを利用しAIくずし字認識スマホアプリ「みを」を開発し無料アプリで公開した。

研究成果の学術的意義や社会的意義

日本ではくずし字が千年以上も前から使われており、数億点規模の資料が保管されているが、現代日本人はそれらの資料を利用できない問題がある。この問題は日本の歴史的資料の保存と活用を阻む一つの原因となっている。本研究で開発した認識モデルやさまざまなサービスはこの問題を解決するためである。そして、誰でも簡単にくずし字認識モデルを利用することを実現した。国内外の博物館や図書館が公開した画像はIIIF KuroNetくずし字認識サービスで、ユーザの手持ちの資料は「みを」アプリでくずし字認識を行える。最後にくずし字データセットやKaggleコンペを通して、海外の研究者にも日本文化への関心が高めたともいえよう。

報告書

(4件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (27件)

すべて 2022 2021 2020 2019 その他

すべて 雑誌論文 (7件) (うち国際共著 2件、 査読あり 6件、 オープンアクセス 3件) 学会発表 (15件) (うち国際学会 8件、 招待講演 12件) 備考 (5件)

  • [雑誌論文] 資料調査のためのAIくずし字認識スマホアプリ「みを」2021

    • 著者名/発表者名
      カラーヌワット タリン , 北本 朝展
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2021論文集

      巻: 1 ページ: 302-309

    • NAID

      170000186266

    • 関連する報告書
      2021 実績報告書
    • 査読あり
  • [雑誌論文] Kaggle くずし字認識 ─世界規模の人文系コンペ開催への挑戦─2020

    • 著者名/発表者名
      北本 朝展 , カラーヌワット タリン , ボーバー・イリザー ミケル
    • 雑誌名

      人工知能学会誌

      巻: 35 ページ: 366-376

    • NAID

      130007917848

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [雑誌論文] KuroNet: Regularized Residual U-Nets for End-to-End Kuzushiji Character Recognition2020

    • 著者名/発表者名
      Alex Lamb , Tarin Clanuwat , Asanobu Kitamoto
    • 雑誌名

      SN Computer Science

      巻: 1 号: 3 ページ: 1-15

    • DOI

      10.1007/s42979-020-00186-z

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] くずし字認識の進化とサービス化の展開2020

    • 著者名/発表者名
      カラーヌワット タリン , 北本朝展
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2020論文集

      巻: - ページ: 3-10

    • NAID

      170000183917

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [雑誌論文] 文字データの分析――機械学習によるくずし字認識の可能性とそのインパクト――2019

    • 著者名/発表者名
      北本 朝展 , カラーヌワット タリン , 宮崎 智 , 山本 和明
    • 雑誌名

      電子情報通信学会誌

      巻: 102 ページ: 563-568

    • 関連する報告書
      2019 実施状況報告書
    • オープンアクセス
  • [雑誌論文] くずし字認識のためのKaggle機械学習コンペティションの経過と成果2019

    • 著者名/発表者名
      北本 朝展 , カラーヌワット タリン , Alex LAMB , Mikel BOBER-IRIZAR
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2019論文集

      巻: - ページ: 223-230

    • NAID

      170000180927

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] KuroNet: Pre-Modern Japanese Kuzushiji Character Recognition with Deep Learning2019

    • 著者名/発表者名
      Tarin Clanuwat, Alex Lamb, Asanobu Kitamoto
    • 雑誌名

      The International Conference on Document Analysis and Recognition (ICDAR) Proceeding

      巻: 2019 ページ: 1-8

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] AIによるくずし字認識の研究2022

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Seminar: An Invitation to Digital Humanities: AI, Research Collaboration, Haruki Murakami Library, Waseda University and Digital Transformation,
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] Nissan Seminar: Deciphering pre-modern Japanese manuscripts: kuzushiji recognition systems and AI,2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Oxford School of Global and Area Studies, University of Oxford
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] miwo Kuzushiji recognition smartphone application with AI,2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      The Alan Turing Inistutite
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] AIくずし字認識アプリ「みを」プロジェクトから学んだこと2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Google Cloud Summit
    • 関連する報告書
      2021 実績報告書
    • 招待講演
  • [学会発表] “miwo” AI Kuzushiji Recognition Application for Japanese Historical Document2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Ritsumeikan University Art Research Center
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] AIくずし字認識アプリ「みを」:機械学習の運用の課題2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      NeurIPS Meetup Japan
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] 資料調査のための AI くずし字認識スマホアプリ「みを」2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      情報処理学会、人文科学とコンピュータシンポジウム
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Japanese Culture and AI2021

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      JST Sakura Science Club, Japan Science and Technology Agency
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] くずし字認識の進化とサービス化の展開2020

    • 著者名/発表者名
      カラーヌワット・タリン
    • 学会等名
      人文科学とコンピュータシンポジウム じんもんこん2020
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Kuzushiji and Premodern Japanese Studies: Learning Resources and Artificial Intelligence Initiatives2020

    • 著者名/発表者名
      Tarin Clanuwat
    • 学会等名
      Centre for Japanese Research, the University of British Columbia, Canada
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] AIとみんなで翻刻2020

    • 著者名/発表者名
      カラーヌワット・タリン
    • 学会等名
      みんなで翻刻サミット
    • 関連する報告書
      2020 実施状況報告書
    • 招待講演
  • [学会発表] 世界中のアイデアを集めるくずし字コンペの開催2019

    • 著者名/発表者名
      カラーヌワット・タリン
    • 学会等名
      日本文化とAIシンポジウム
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] くずし字xAIオンラインで世界に開く日本古典籍2019

    • 著者名/発表者名
      カラーヌワット・タリン
    • 学会等名
      DMC 研究センターシンポジウム、第9回 大学教育のミライ:オープンエデュケーションのその先へ
    • 関連する報告書
      2019 実施状況報告書
    • 招待講演
  • [学会発表] Kuzushiji and AI : A Case Study of Multidisciplinary Research2019

    • 著者名/発表者名
      カラーヌワット・タリン
    • 学会等名
      次世代日本研究者協働研究ワークショップ
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] AIによるくずし字認識、古典文学と情報学の世界的なコラボレーション2019

    • 著者名/発表者名
      カラーヌワット・タリン
    • 学会等名
      総研大文化フォーラム2019
    • 関連する報告書
      2019 実施状況報告書
    • 招待講演
  • [備考] みを(miwo) - AIくずし字認識アプリ

    • URL

      http://codh.rois.ac.jp/miwo/

    • 関連する報告書
      2021 実績報告書
  • [備考] 浮世絵顔データセット

    • URL

      http://codh.rois.ac.jp/ukiyo-e/face-dataset/index.html

    • 関連する報告書
      2021 実績報告書
  • [備考] KuroNetくずし字認識サービス(AI OCR)

    • URL

      http://codh.rois.ac.jp/kuronet/

    • 関連する報告書
      2020 実施状況報告書
  • [備考] KuroNetくずし字認識サービス

    • URL

      http://codh.rois.ac.jp/kuronet/

    • 関連する報告書
      2019 実施状況報告書
  • [備考] AIくずし字認識(一文字)

    • URL

      http://codh.rois.ac.jp/char-shape/app/single-mobilenet/

    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi