2002 Fiscal Year Annual Research Report
古文書解読支援システムの開発と電子辞書技術の応用に関する研究
Project/Area Number |
12558037
|
Research Institution | Osaka City University |
Principal Investigator |
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
|
Co-Investigator(Kenkyū-buntansha) |
並木 美太郎 東京農工大学, 工学部, 助教授 (10208077)
原 正一郎 国文学研究資料館, 研究情報学部, 助教授 (50218616)
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
岩崎 宏之 大阪市立大学, 学術情報総合センター, 教授 (50087904)
川口 洋 帝塚山大学, 経営情報学部, 教授 (80224749)
|
Keywords | 古文書認識 / 文字認識 / 辞書データベース / くずし字解読 / 電子辞書 |
Research Abstract |
本研究の目的は、歴史学・古文書学や文学の専門家が古文書解読を行う際に利用する"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)、"くずし字用例辞典"(字形索引による用例抽出)をコンピュータ上に実装し、モバイル環境で利用可能な電子辞書の開発を行うこと、及び本研究の過程で得られる字形認識プロセスを別途科研費で進めている古文書翻刻支援システム(古文書OCR)の文字認識に直接応用しようとすることにある. 本年度は、以下に示す研究実績を上げた。 (1)電子辞書の構築として、以下に示す古文書文字データベースHCDシリーズの第2版を作成した。 HCD2 借金証文標題行 伏見屋善兵衛文書 200行 1,378字 2値 HCD2a 借金証文標題行 伏見屋善兵衛文書 200行 1,378字 256階調 HCD2b 借金証文標題行 伏見屋善兵衛文書 200行 1,378字 24bitsカラー HCD3 借金証文標題行 伏見屋善兵衛文書 183字種 4,933字 2値 (2)上記の辞書を使用して、標題行による古文書認識研究を進めた。あらかじめ標題行の各文字を切り出さずに、辞書に存在する文字パターンをテンプレートとするマッチング手法の研究を進めた。 (3)"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)の「くずし字辞書データベース」から筆順を抽出し、推定する研究をすすめた。 (4)文字認識研究における台湾中央研究院での交流を行うための調査を行った。また、近隣諸国における毛筆文書画像の研究に対する調査に着手した。 なお、研究成果については、裏面の雑誌論文のほか、研究成果報告書を刊行する準備を行っている。
|
Research Products
(4 results)
-
[Publications] 山田奨治, 柴山 守他: "類似文字検索機能をそなえた電子くずし字辞典の開発"情報処理学会研究報告2002-CH-54. Vol.2002,No.23. 43-50 (2002)
-
[Publications] 山田奨治, 柴山 守: "古文書を対象にした文字認識の研究"情報処理. Vol.43 No.9. 950-955 (2002)
-
[Publications] 近藤博人, 松本隆一, 柴山 守, 山田奨治, 荒木義彦: "文字切出しを前提としない古文書標題認識"情報処理学会研究報告2003-CH-57. Vol.2003,No.5. 1-8 (2002)
-
[Publications] 安倍広多, 中塚麻記子, 柴山 守: "『くずし字解読辞典』文字画像からの筆順抽出の試み"大阪市立大学学術情報総合センター紀要. Vol.4. 19-23 (2003)