1992 Fiscal Year Annual Research Report
日本史史料全文テキスト・データベース講築のための効率的漢字入力システムの開発
Project/Area Number |
02551006
|
Research Institution | Japan Women's University |
Principal Investigator |
永村 眞 日本女子大学, 文学部, 教授 (40107470)
|
Co-Investigator(Kenkyū-buntansha) |
吉田 早苗 東京大学, 史料編纂所, 助教授 (00110693)
山岸 常人 奈良国立文化財研究所, 飛鳥藤原宮跡発堀調査部, 主任研究官 (00142018)
小篠 洋一 タウ技研株式会社, 副社長
|
Keywords | テキスト・データベース / 漢字OCR / KWICK索引 / 日本史史料 / 醍醐雑事記 |
Research Abstract |
1.OCR自動読取システムの機能改良 昨年度に開発した逸行配列文字列の自動読取システムを稼動させるとともに、その機能上の問題点について処理プログラムの改良を行い、読取効率の向上を図った。 2.KWICK索引編成システムの開発 漢字OCRによりデータファイルに蓄積された史料文字列データの有効活用を目指し、蓄積された文字個々を登録音読順に配列し、前後の文字列を併せて出力するKWICK索引の編成システムを開発した。 3.漢字字種統一テーブルの構築 漢字データの配列や漢字文字列検索に必須の条件としての、JISコード上に複数掲げられる異体字種の統一を図るために、異体と統一字体を定義する漢字字種テーブルを作成し、KWICK索引編成システムに組み込んだ。 4.KWICK索引編成システムの稼働・検収 開発したKWICK索引編成システムを試験稼働させて機能改良を施し、システムを検収した。 5.『醍醐雑事記』KWICK索引の編成 検収したKWICK索引編成システムを稼働させ、『醍醐雑事記』から入力したデータにより、KWICK索引を作成した。
|