• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

人工知能による日本の歴史的典籍の自動翻刻システムの構築およびその活用に関する研究

研究課題

研究課題/領域番号 16K02433
研究機関豊田工業高等専門学校

研究代表者

早坂 太一  豊田工業高等専門学校, 情報工学科, 准教授 (50314092)

研究分担者 加藤 弓枝  豊田工業高等専門学校, 一般学科, 准教授 (10413783)
大野 亙  豊田工業高等専門学校, 電気・電子システム工学科, 准教授 (60321444)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード深層学習 / くずし字 / 文字認識 / WWWアプリケーション
研究実績の概要

国文学研究資料館古典籍共同研究事業センターにより構築が進められている「日本語の歴史的典籍データベース」は、これを有効活用することで、異分野を融合させた研究の展開も期待されるが、いかに資料が集積されたとしても、多くの研究者にとっては、書かれている文字が「くずし字」であることが障壁となる。本研究は、世界的に注目されている人工知能技術である、ディープラーニングを用いたくずし字の自動翻刻システムの構築を目的とする。
『日本古典籍字形データセット』をはじめとするオープンデータから6万字以上の変体仮名画像を利用してモデルを学習させた。そして、オープンデータとして公開されている「源氏物語」等、いくつかの歴史的典籍内の変体仮名に対して、ディープラーニングによる認識の精度を算出したところ、いずれも90%以上の結果を示すことができた。
また、古典籍の画像データを読み込み、マウス等で選択された1文字分の変体仮名を翻刻するWWWアプリケーションを作製した(http://vpac.toyota-ct.ac.jp/kuzushiji/)。読み込まれた画像に対し画像処理を施し、学習されたモデルに入力することで、平仮名ごとの認識確率が円グラフとして表示される。表示については、クライアント側の計算機環境に依存するが、サーバ側で1文字あたりの認識にかかる時間は約0.4秒であった。高性能なハードウェアやGPGPUを利用しなくとも、十分な演算速度による翻刻が実現できることが確認できた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

変体仮名の認識については、交付申請書内でも目標とした90%以上の精度を示すことができ、プロトタイプとしてではあるが、WWWアプリケーションとしての実現を達成できた。
また、学習に用いるくずし字画像については、国立情報学研究所からオープンデータとして提供されているものも合わせて、約10万字を抽出できている。
さらに、近隣の学校でのくずし字に関する出前授業の際に、どのようなアプリケーション・ソフトウェアを望むかといったアンケートも行い、仕様を策定している途中である。

今後の研究の推進方策

今後は、漢字を含めたくずし字の認識、ソフトウェアのプラグイン(Web API)化、複数のくずし字の切り分け、ソフトウェアだけでなく、ハードウェア(組込みシステム)としてのくずし字認識システムの開発などが、やるべきこととして挙げられる。

次年度使用額が生じた理由

主に国内旅費および謝金に繰り越しが生じた。これは、学会発表およびくずし字抽出のための謝金について、実際の支払額が少なかったことによるものである。物品費については,他の補助金により充当されたことが大きな原因である。

次年度使用額の使用計画

今年度の学会発表のための旅費およびくずし字抽出のための謝金に利用する予定である。物品費については,ワークステーション購入に充てる予定である。

備考

中日新聞2016年11月2日朝刊13面「古典籍のくずし字翻刻 コンピュータ技術で楷書体に」という記事において、本研究の取り組みが紹介された。

  • 研究成果

    (3件)

すべて 2016 その他

すべて 学会発表 (2件) 備考 (1件)

  • [学会発表] ディープラーニングによる変体仮名の翻刻およびWWWアプリケーション開発の試み2016

    • 著者名/発表者名
      早坂太一, 大野亙, 加藤弓枝, 山本和明
    • 学会等名
      情報処理学会人文科学とコンピュータシンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2016-12-10
  • [学会発表] ディープラーニングによる日本語の歴史的典籍におけるくずし字の認識およびWWWアプリケーション開発の試み2016

    • 著者名/発表者名
      早坂太一, 大野亙, 加藤弓枝, 山本和明
    • 学会等名
      電子情報通信学会パターン認識・メディア理解研究会
    • 発表場所
      宮崎大学
    • 年月日
      2016-10-20
  • [備考] 豊田高専・くずし字翻刻WWWサービス

    • URL

      http://vpac.toyota-ct.ac.jp/kuzushiji/

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi