1999 Fiscal Year Annual Research Report
Project/Area Number |
11410090
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Osaka City University |
Principal Investigator |
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
|
Co-Investigator(Kenkyū-buntansha) |
大島 真理夫 大阪市立大学, 経済学部, 教授 (30128730)
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
塚田 孝 大阪市立大学, 文学部, 助教授 (60126125)
星野 聡 京都大学, 名誉教授 (90025867)
川口 洋 帝塚山大学, 経営情報学部, 助教授 (80224749)
|
Keywords | 古文書画像 / 文字認識 / OCR / 文字切出し / 古文書認識 / 近世文書 / 自動読み取り |
Research Abstract |
本研究は、近世文書を対象に古文書OCR(Optical Character Reader-本研究では、自動読み取りに解釈する)の実現を目指して、古文書の文字認識におけるメカニズムを解明し、基礎的で限定的な文字認識システムの開発によって、既存の史料を新しい視点で読み直し、解釈する機会を与えて、日本史研究を援用しようとする試論的な研究である。本年度は、初年度で諸実験の準備段階である。 本年度の研究成果は、主に古文書約2,000画像(伏見屋善兵衛文書)から標題を会話型で抽出する研究を行い、以下に示す作業を行う基盤を整備した。 (1)古文書文字認識辞書の構築-個別文字抽出のために当該文書の翻刻作業、及びマークアップ作業、 (2)古文書文字の切出し・認識の基礎的研究-続け字・くずし字の程度による問題を探る、特に射影ヒストグラム法、ラベリング法などを適用して実験を行っている。 (3)古文書文字の切り出し過程におけるユーザーインターフェースの開発 等の部分的成果をあげ、続いて継続的して研究を行っている。
|
-
[Publications] 尾崎浩司、柴山守、荒木義彦: "古文書レイアウト画像のピラミット型抽象化と標題の自動抽出"電気関係学会関西支部連合大会論文集 G12-6. G266 (1999)
-
[Publications] 山田奨治 他: "古文書翻刻支援システム開発プロジェクト報告(1)"情報処理学会研究報告 2000-CH-45. 2000.8. 1-8 (2000)
-
[Publications] 和泉勇治、加藤 寧 他: "ニューラルネットワークを用いた古文書個別文字認識に関する一検討"情報処理学会研究報告 2000-CH-45. 2000.8. 9-15 (2000)