Developing a Historical Document Analysis System Using Hand-written OCR Techomology

Research Project

Project/Area Number	11558045
Research Category	Grant-in-Aid for Scientific Research (B)
Allocation Type	Single-year Grants
Section	展開研究
Research Field	情報システム学(含情報図書館学)
Research Institution	International Research Center for Japanese Studies
Principal Investigator	YAMADA Shoji International Research Center for Japanese Studies, Research Department, Associate Professor, 研究部, 助教授 (20248751)
Co-Investigator(Kenkyū-buntansha)	UMEDA Michio Osaka Electo?Communication University Faculty of Information Science and Art Professor, 情報工学部, 教授 (30213490) KAWAGUCHI Hiroshi Tezukayama University Faculuty of Business Administration Associate Professor, 経営情報学部, 助教授 (80224749) SHIBAYAMA Mamoru Osaka City university,Media Center,Professor, 学術情報総合センター, 教授 (10162645) KATO Nei Tohoku University,Graduate School of Information Science Associate Professor, 大学院・情報科学研究科, 助教授 (00236168) ISHITANI Yasuto toshiba,R&D Center,Chief Engineer, 研究開発センター, 主任
Project Period (FY)	1999 – 2001
Project Status	Completed (Fiscal Year 2001)
Budget Amount *help	¥10,300,000 (Direct Cost: ¥10,300,000) Fiscal Year 2001: ¥2,100,000 (Direct Cost: ¥2,100,000) Fiscal Year 2000: ¥5,300,000 (Direct Cost: ¥5,300,000) Fiscal Year 1999: ¥2,900,000 (Direct Cost: ¥2,900,000)
Keywords	Historical Document / Character Recognition / OCR / Character Segmantation / Electrical Dictionary / 文字切り出し
Research Abstract	In this research project, we could obtain the following results. (1) The basic research on the Historical Character Recognition. We examined on some special requirements for the character recognition and segmentation of historical characters. By using a small data set of historical characters, we obtained 95 percents of correct recognition ratio applying Japanese hand-written character recognition technology. We also developed some new technology of segmentation and normalization of historical characters. (2) Historical character database for recognition studies. We made some database to put the study of historical character recognition into progress. The database contain over 250 thousands characters. (3) Interface prototyping of historical document analyzing system. We developed prototype systems of historical document analyzing system. One is a system with a function of presenting correct character candidates of unreadable character using n-gram information. The other is a prototype system of electrical dictionary for historical characters. The dictionary has a function of similar character search, which is an application of hand-written character recognition.

Report

(4 results)

2001 Annual Research Report Final Research Report Summary
2000 Annual Research Report
1999 Annual Research Report

Research Products
(20 results)

All Other

All Publications (20 results)

[Publications] 山田奨治ほか: "古文書翻刻支援システム(HCR)開発プロジェクト報告(2)"情報処理学会研究報告. 2001,51. 9-16 (2001)
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] 篠原早苗ほか: "SVMによる手書き類似文字認識の学習データ選択と認識精度に関する一考察"2001年電子情報通信学会ソサイティ大会. D-12-8. 183 (2001)
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] 橋本智広ほか: "天保郷帳における石高表記文字の個別認識"情報処理学会研究報告. 2002,8. 55-62 (2002)
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] 山田奨治, 柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] 尾崎浩司, 柴山守ほか: "古文書画像の標題文字セグメンテーション"人文科学とコンピュータシンポジウム論文集. 2000. 279-286 (2000)
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] 柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センターセミナー報告. 67. 70-79 (2001)
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] Shoji Yamada et. al.: "Komonjo Honkoku Shien System (HCR) Kaihatsu Project Houkoku (2)"Jouhousyorigakkai Kenkyu Houkoku. 2001-51. 9-16 (2001)
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] Sanae Shinohara et. al.: "SVM niyoru Tegaki Ruiji Moji Ninshiki no Gakusyu Data Sentaku to Ninshiki Seido ni kansuru Ichikousatsu"2001nen Denshi Jouho Tuushin Gakkai Society Taikai. D-12-8. 183 (2001)
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] Tomohiro Hasahimoto et. al.: "Tenpou Goucho ni okeru Kokudaka Hyouki Moji no Kobetsu Ninshiki"Jouhousyorigakkai Kenkyu Houkoku. Aug-02. 55-62 (2002)
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] Shoji Yamada and Mamoru Shibayama: "n-gram ni yoru Komonjyo Syoumonrui Honkoku Shien no Kento"Jinbunkagakuto Computer Symposium Ronbunsyu. 2000. 185-192 (2000)
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] Kouji Ozaki, Mamoru Shibayama et. al.: "Komonjo Gazou no Hyoudai Moji Segmentation"Jinbunkagakuto Computer Symposium Ronbunsyu. 2000. 279-286 (2000)
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] Mamoru Shibayama: "Syoumonrui Komonjo Hyoudai no Moji Ninshiki Jisyo Kouchiku to sono Riyou ni tsuite"Kyotodaigaku Oogatakeisanki Center Seminoe Houkoku. 67. 70-79 (2001)
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2001 Final Research Report Summary
[Publications] 山田奨治ほか: "古文書翻刻支援システム(HCR)開発プロジェクト報告(2)"情報処理学会研究報告. 2001, 51. 9-16 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 篠原早苗ほか: "SVMによる手書き類似文字認識の学習データ選択と認識精度に関する一考察"2001年電子情報通信学会ソサイエティ大会. D-12-8. 183 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 橋本智広ほか: "天保郷帳における石高表記文字の個別認識"情報処理学会研究報告. 2002, 8. 55-62 (2002)
- Related Report
  2001 Annual Research Report
[Publications] 山田奨治,柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)
- Related Report
  2000 Annual Research Report
[Publications] 尾崎浩司,柴山守ほか: "古文書画像の標題文字セグメンテーション"人文科学とコンピュータシンポジウム論文集. 2000. 279-286 (2000)
- Related Report
  2000 Annual Research Report
[Publications] 柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センターセミナー報告. (掲載予定).
- Related Report
  2000 Annual Research Report
[Publications] 山田奨治ほか: "古文書翻刻支援システム開発プロジェクト報告(1)プロジェクト概要"情報処理学会研究報告. 2000, 8. 1-8 (2000)
- Related Report
  1999 Annual Research Report
[Publications] 和泉勇治ほか: "ニューラルネットワークを用いた古文書個別文字認識に関する-検討"情報処理学会研究報告. 2000, 8. 9-15 (2000)
- Related Report
  1999 Annual Research Report

Developing a Historical Document Analysis System Using Hand-written OCR Techomology

Principal Investigator

YAMADA Shoji International Research Center for Japanese Studies, Research Department, Associate Professor, 研究部, 助教授 (20248751)

¥10,300,000 (Direct Cost: ¥10,300,000)

Report

Research Products

[Publications] 山田奨治ほか: "古文書翻刻支援システム(HCR)開発プロジェクト報告(2)"情報処理学会研究報告. 2001,51. 9-16 (2001)

Description

Related Report

[Publications] 篠原早苗ほか: "SVMによる手書き類似文字認識の学習データ選択と認識精度に関する一考察"2001年電子情報通信学会ソサイティ大会. D-12-8. 183 (2001)

Description

Related Report

[Publications] 橋本智広ほか: "天保郷帳における石高表記文字の個別認識"情報処理学会研究報告. 2002,8. 55-62 (2002)

Description

Related Report

[Publications] 山田奨治, 柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)

Description

Related Report

[Publications] 尾崎浩司, 柴山守ほか: "古文書画像の標題文字セグメンテーション"人文科学とコンピュータシンポジウム論文集. 2000. 279-286 (2000)

Description

Related Report

[Publications] 柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センターセミナー報告. 67. 70-79 (2001)

Description

Related Report

[Publications] Shoji Yamada et. al.: "Komonjo Honkoku Shien System (HCR) Kaihatsu Project Houkoku (2)"Jouhousyorigakkai Kenkyu Houkoku. 2001-51. 9-16 (2001)

Description

Related Report

[Publications] Sanae Shinohara et. al.: "SVM niyoru Tegaki Ruiji Moji Ninshiki no Gakusyu Data Sentaku to Ninshiki Seido ni kansuru Ichikousatsu"2001nen Denshi Jouho Tuushin Gakkai Society Taikai. D-12-8. 183 (2001)

Description

Related Report

[Publications] Tomohiro Hasahimoto et. al.: "Tenpou Goucho ni okeru Kokudaka Hyouki Moji no Kobetsu Ninshiki"Jouhousyorigakkai Kenkyu Houkoku. Aug-02. 55-62 (2002)

Description

Related Report

[Publications] Shoji Yamada and Mamoru Shibayama: "n-gram ni yoru Komonjyo Syoumonrui Honkoku Shien no Kento"Jinbunkagakuto Computer Symposium Ronbunsyu. 2000. 185-192 (2000)

Description

Related Report

[Publications] Kouji Ozaki, Mamoru Shibayama et. al.: "Komonjo Gazou no Hyoudai Moji Segmentation"Jinbunkagakuto Computer Symposium Ronbunsyu. 2000. 279-286 (2000)

Description

Related Report

[Publications] Mamoru Shibayama: "Syoumonrui Komonjo Hyoudai no Moji Ninshiki Jisyo Kouchiku to sono Riyou ni tsuite"Kyotodaigaku Oogatakeisanki Center Seminoe Houkoku. 67. 70-79 (2001)

Description

Related Report

[Publications] 山田奨治ほか: "古文書翻刻支援システム(HCR)開発プロジェクト報告(2)"情報処理学会研究報告. 2001, 51. 9-16 (2001)

Related Report

[Publications] 篠原早苗ほか: "SVMによる手書き類似文字認識の学習データ選択と認識精度に関する一考察"2001年電子情報通信学会ソサイエティ大会. D-12-8. 183 (2001)

Related Report

[Publications] 橋本智広ほか: "天保郷帳における石高表記文字の個別認識"情報処理学会研究報告. 2002, 8. 55-62 (2002)

Related Report

[Publications] 山田奨治,柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)

Related Report

[Publications] 尾崎浩司,柴山守 ほか: "古文書画像の標題文字セグメンテーション"人文科学とコンピュータシンポジウム論文集. 2000. 279-286 (2000)

Related Report

[Publications] 柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センターセミナー報告. (掲載予定).

Related Report

[Publications] 山田奨治ほか: "古文書翻刻支援システム開発プロジェクト報告(1)プロジェクト概要"情報処理学会研究報告. 2000, 8. 1-8 (2000)

Related Report

[Publications] 和泉勇治ほか: "ニューラルネットワークを用いた古文書個別文字認識に関する-検討"情報処理学会研究報告. 2000, 8. 9-15 (2000)

Related Report

[Publications] 尾崎浩司,柴山守ほか: "古文書画像の標題文字セグメンテーション"人文科学とコンピュータシンポジウム論文集. 2000. 279-286 (2000)