• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1999 年度 実績報告書

手書き文字OCR技術を援用した古文書翻刻支援システムの開発

研究課題

研究課題/領域番号 11558045
研究種目

基盤研究(B)

研究機関国際日本文化研究センター

研究代表者

山田 奨治  国際日本文化研究センター, 研究部, 助教授 (20248751)

研究分担者 川口 洋  帝塚山大学, 経営情報学部, 助教授 (80224749)
梅田 三千雄  大阪電気通信大学, 情報工学部, 教授 (30213490)
柴山 守  大阪市立大学, 学術情報総合センター, 教授 (10162645)
石谷 康人  (株)東芝ディジタルメディア機器社, 主任
加藤 寧  東北大学, 大学院・情報科学研究科, 助教授 (00236168)
キーワード古文書 / 文字認識 / OCR / 文字切り出し / 文字データベース
研究概要

本研究の目的は、日本語手書き文字OCR技術を展開的に応用した、古文書翻刻支援システムを開発し、歴史学研究の現場において大きな作業量を占めている翻刻作業の負荷を軽減し、歴史学研究を支援することである。平成11年度は、(1)古文書文字認識用辞書構造の決定、(2)古文書画像入力と辞書構築、(3)文字認識部の検討について研究を進めた。(1)に関しては、「宗門改帳」(個人蔵)から採字した年齢表記部分16字種3066サンプルを文字画像データベース化を完了し、(3)の古文書文字認識実験に供している。(2)に関しては、『柳営日次記』(内閣文庫所蔵)の文字データベース化に向けた翻刻作業に着手した。また、文書画像からノイズを除去しながら手作業で文字を切り出し、翻刻文字を入力してデータベース化する作業を支援するためのインタフェースを構築した。さらに、古文書文字の自動切り出しに関する研究を進め、「伏見屋文書」の標題切り出しと『冥報記』の文字切り出しを例に、良好な結果を得た。(3)に関しては、日本語手書き文字OCRで最高の認識率を得ている文字認識エンジンを用いて、(1)で作成した「宗門改帳」年齢表記文字データの認識実験をおこない、96.67%の文字認識性能を確認できた。平成12年度は、「宗門改帳」文字画像データベースをさらに拡充させる。『柳営日次記』の文字データベース化は、継続的に取り組む。また、文字切りだし支援ツールのインタフェースを核に、自動文字切りだし機能とOCR機能を統合してゆく方法を検討する。

  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 山田奨治ほか: "古文書翻刻支援システム開発プロジェクト報告(1)プロジェクト概要"情報処理学会研究報告. 2000, 8. 1-8 (2000)

  • [文献書誌] 和泉勇治ほか: "ニューラルネットワークを用いた古文書個別文字認識に関する-検討"情報処理学会研究報告. 2000, 8. 9-15 (2000)

URL: 

公開日: 2001-10-23   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi