• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

近代書籍自動テキスト化支援環境の構築

研究課題

研究課題/領域番号 26280119
研究種目

基盤研究(B)

配分区分一部基金
応募区分一般
研究分野 図書館情報学・人文社会情報学
研究機関奈良女子大学

研究代表者

城 和貴  奈良女子大学, 生活環境科学系, 教授 (90283928)

研究分担者 高田 雅美  奈良女子大学, 生活環境科学系, 講師 (20397574)
研究協力者 木目 沢司  国立国会図書館西館, 電子図書館課, 書士
研究期間 (年度) 2014-04-01 – 2017-03-31
研究課題ステータス 完了 (2016年度)
配分額 *注記
11,960千円 (直接経費: 9,200千円、間接経費: 2,760千円)
2016年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2015年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2014年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
キーワード近代書籍用OCR / 文字認識 / 特徴量 / アンサンブル学習 / 特徴抽出 / Webアプリケーション / 遺伝的プログラミング / コンテンツ・アーカイブ / テキスト化 / 近代書籍テキスト化 / 進化計算 / Webサービス / データベース / デジタルアーカイブ / Webプログラミング
研究成果の概要

本研究課題では近代書籍の自動テキスト化を実現するために必要な学習データを効率良く集めるための支援環境を構築した。規格化された現在の書籍用フォントと違い、近代書籍の活版印刷によるフォントにはデータベース等は存在せず、近代書籍から直接画像を切り出し学習データを作成しなければならないが、文字種が1000種類くらいまでは人手でも困難なく収集できるが、2000種を数える頃には困難を極める。そこで不完全ながら学習データを備えた近代文字認識システムを構築し、それに新たな近代書籍を適用し、正しく認識できない未学習の文字を表示させ、その文字種を人間が判断して学習データに追加するシステムを構築した。

報告書

(4件)
  • 2016 実績報告書   研究成果報告書 ( PDF )
  • 2015 実績報告書
  • 2014 実績報告書
  • 研究成果

    (8件)

すべて 2016 2015

すべて 雑誌論文 (3件) (うち査読あり 3件、 謝辞記載あり 2件、 オープンアクセス 1件) 学会発表 (5件) (うち国際学会 1件、 招待講演 2件)

  • [雑誌論文] 近代書籍を対象とした多フォント漢字認識2016

    • 著者名/発表者名
      粟津 妙華, 上坂 和美,高田 雅美, 城 和貴
    • 雑誌名

      情報処理学会論文誌数理モデル化と応用

      巻: 9(2) ページ: 33-40

    • NAID

      170000148129

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Comparison of Feature Extraction Methods for Early-Modern Japanese Printed Character Recognition2016

    • 著者名/発表者名
      Kazumi Kosaka, Kaori Fujimoto, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 雑誌名

      Proceedings of PDPTA2016

      巻: Final Edition ページ: 408-414

    • 関連する報告書
      2016 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] 活字データの分類を用いた進化計算による近代書籍からのルビ除去2015

    • 著者名/発表者名
      粟津 妙華, 高田 雅美, 城 和貴
    • 雑誌名

      情報処理学会論文誌数理モデル化と応用

      巻: 8-1 ページ: 72-79

    • NAID

      110009886645

    • 関連する報告書
      2014 実績報告書
    • 査読あり
  • [学会発表] デジタルコレクション 自動テキスト化への道2016

    • 著者名/発表者名
      城 和貴
    • 学会等名
      国立国会図書館 デジタルライブラリーカフェ
    • 発表場所
      国立国会図書館
    • 年月日
      2016-11-25
    • 関連する報告書
      2016 実績報告書
    • 招待講演
  • [学会発表] Comparison of Feature Extraction Methods for Early-Modern Japanese Printed Character Recognition2016

    • 著者名/発表者名
      Kazumi Kosaka, Kaori Fujimoto, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 学会等名
      PDPTA2016 MPS workshop
    • 発表場所
      米国ラスベガス
    • 年月日
      2016-07-25
    • 関連する報告書
      2015 実績報告書
    • 国際学会
  • [学会発表] 近代書籍用OCRのための学習用特定フォントセットの自動生成手法2015

    • 著者名/発表者名
      岩田彩, 上坂和美, 粟津妙華, 石川由羽, 高田雅美, 城和貴
    • 学会等名
      情報処理学会数理モデル化と問題解決研究会
    • 発表場所
      北見工業大学
    • 年月日
      2015-09-22
    • 関連する報告書
      2015 実績報告書
  • [学会発表] An Effective and Interactive Training Data Collection Method for Early-Modern Japanese Printed Character Recognition2015

    • 著者名/発表者名
      Kazumi Kosaka, Taeka Awazu , Yu Ishikawa , Masami Takata, and Kazuki Joe
    • 学会等名
      PDPTA2015 MPS workshop
    • 発表場所
      米国ラスベガス
    • 年月日
      2015-07-27 – 2015-07-30
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 近代デジタルライブラリーの自動テキスト化-OCRと共同校正の課題解決に向けた技術-2015

    • 著者名/発表者名
      城 和貴
    • 学会等名
      国立国会図書館主催講演会
    • 発表場所
      国立国会図書館関西館
    • 年月日
      2015-03-05
    • 関連する報告書
      2014 実績報告書
    • 招待講演

URL: 

公開日: 2014-04-04   更新日: 2018-03-22  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi