1991 Fiscal Year Annual Research Report
日本史史料会文テキスト・デ-タベ-ス構築のための効率的漢字入力システムの開発
Project/Area Number |
02551006
|
Research Institution | Japan Women's University |
Principal Investigator |
永村 眞 日本女子大学, 文学部, 助教授 (40107470)
|
Co-Investigator(Kenkyū-buntansha) |
吉田 早苗 東京大学, 史料編纂所, 助教授 (00110693)
山岸 常人 奈良国立文化財研究所, 藤原調査部, 主任研究官 (00142018)
小篠 洋一 タウ技研株式会社, 副社長
|
Keywords | テキスト・デ-タベ-ス / 日本史史料 / 漢字OCR / 可変長デ-タ処理 / 醍醐雑事記 |
Research Abstract |
1、史料デ-タOCR読取システムの開発 開発システムの概要・詳細設計の仕様に基づき、下記二種類の処理プログラムの開発を外注した。 A、拡張漢字デ-タ登録システム 史料群毎に頻出する未登録の漢字を新規に登録し、読取り効率を高める。 B、逸行配列文字列の自動読取 逐行配列のなかに混在する行間書と双行の文字列を自動的に認識し、読取り処理を実行する。 2、史料デ-タOCR読取システムの稼働・検収 上記の処理プログラムを試験的に稼働させて問題点を明らかにし、実用のための準備を行った。 3、醍醐雑事記の校訂 読取り処理の素材として醍醐雑事記をとりあげ、その入力に先行して読点の付与等の前処理をほどこした。 4、醍醐雑事記の読取作業 設置機器に移植した処理システムにより、醍醐雑事記の読取り作業に着手した。
|
Research Products
(1 results)