2000 Fiscal Year Annual Research Report
Project/Area Number |
11410090
|
Research Institution | Osaka City University |
Principal Investigator |
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
|
Co-Investigator(Kenkyū-buntansha) |
並木 美太郎 東京農工大学, 工学部, 助教授 (10208077)
塚田 孝 大阪市立大学, 文学部, 助教授 (60126125)
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
星野 聰 京都大学, 名誉教授 (90025867)
川口 洋 帝塚山大学, 経営情報学部, 助教授 (80224749)
|
Keywords | 古文書画像 / 文字認識 / OCR / 文字切出し / 古文書認識 / 古文書翻刻支援 |
Research Abstract |
本研究の目的は、近世文書を対象に古文書OCR(Optical Character Reader-本研究では、自動読み取りに解釈する)の実現を目指して、古文書の文字認識におけるメカニズムを解明し、基礎的で限定的な文字認識システムの開発によって、既存の史料を新しい視点で読み直し、解釈する機会を与えて、日本史研究を援用しようとする試論的な研究である。 本年度の研究実績は、以下のとおりである。 (1)古文書文字認識辞書の構築では、標題文字に注目し、約4,900字種の文字認識辞書を構築した。 (2)古文書文字の切出し・認識の基礎的研究では、古文書画像のレイアウト認識を行い、標題の自動抽出を目指す研究を行うと共に従来方式とは異なる文字認識実験を行った。 (3)n-gramによる証文類古文書の翻刻支援への有効性について確認した。 (4)古文書文字認識過程において、従来型の正規化過程では、類似性が高く問題点の研究を進めた。 (5)証文類古文書から標題のみを切出して、認識実験が行える標題文字データベースを構築中である。
|
Research Products
(5 results)
-
[Publications] 山田奨治,柴山守 他: "古文書翻刻支援システム開発プロジェクト報告(1)"情報処理学会研究報告2000-CH-45. 2000・5. 1-8 (2000)
-
[Publications] 和泉勇治,加藤寧 他: "ニューラルネットワークを用いた古文書文字認識に関する一検討"情報処理学会研究報告2000-CH-45. 2000・5. 9-15 (2000)
-
[Publications] 山田奨治,柴山守 他: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム2000論文集. (2000)
-
[Publications] 尾崎浩司,柴山守 他: "古文書画像のレイアウト認識と標題抽出"情報処理学会研究報告2000-CH-47. 2000・67. 47-54 (2000)
-
[Publications] 尾崎浩司,柴山守 他: "古文書画像の標題文字セグメンテーション"人文科学とコンピュータシンポジウム2000論文集. (2000)