2000 Fiscal Year Annual Research Report
古文書解読支援システムの開発と電子辞書技術の応用に関する研究
Project/Area Number |
12558037
|
Research Institution | Osaka City University |
Principal Investigator |
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
|
Co-Investigator(Kenkyū-buntansha) |
並木 美太郎 東京農工大学, 工学部, 助教授 (10208077)
原 正一郎 国文学研究資料館, 研究情報部, 助教授 (50218616)
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
岩崎 宏之 常磐大学, ユミュティ振興学部, 教授 (50087904)
川口 洋 帝塚山大学, 経営情報学部, 助教授 (80224749)
|
Keywords | 古文書認識 / 文字認識 / 辞書データベース / 古文書解読支援 / くずし字解読 |
Research Abstract |
本研究の目的は、歴史学・古文書学や文学の専門家が古文書解読を行う際に利用する"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)、"くずし字用例辞典"(字形索引による用例抽出)をコンピュータ上に実装し、モバイル環境で利用可能な電子辞書の開発を行うこと、及び本研究の過程で得られる字形認識プロセスを別途科研費で進めている古文書翻刻支援システム(古文書OCR)の文字認識に直接応用しようとすることにある.本年度は、以下に示す研究実績を上げた。 (1)"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)の字形索引、及び熟語を1字毎に画像(スキャナー)入力し、"くずし字解読辞典"コード、"文字鏡"コード、シフトJISコードを付加した「くずし字辞書データベース」の構築を行った。 (2)モバイル環境のペン入力で本辞書を利用できる検索・認識技術の検討を行った。 (3)古文書翻刻支援システム(古文書OCR)にn-gramを適用し、その有効性を確認した。
|
Research Products
(4 results)
-
[Publications] 尾崎浩司,柴山守 他: "古文書画像のレイアウト認識を標題抽出"情報処理学会研究報告. 2000・67. 47-54 (2000)
-
[Publications] 山田奨治,柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム2000論文集.
-
[Publications] 尾崎浩司,柴山守 他: "古文書画像の標題文字セグメンテーション"人文科学をコンピュータシンポジウム2000論文集.
-
[Publications] 柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センター第67回研究セミナー. (2001)