研究課題
基盤研究(C)
初年度の目標は、統計表のデータベース化システムの構築であったが、イギリスの歴史的な統計表で使用されている数字をソフトに認識させる過程に予想を遥かに越える困難があった。そのような困難もOCRソフトの学習機能を活用した認識精度の向上によってある程度克服され、システムの構築、および構築後の微調整と試運転という目標は一応達成できたといいうる。第2年度においては、計画時点での目標の一つであったデータベース化の速度の向上に専念した。OCRソフトの認識精度の向上には限界があるため、数値以外の項目をあらかじめ手入力したフォーマットを作成し、そこにOCRで読み込んだ数値データを落とし込む、という方策を試みた。この手法によって、データベース化の速度は2倍以上に高まったが、イギリスの歴史的な書体の数字はOCRソフトにとって難物であり、手作業による修正は欠かせなかった。第2年度終了の時点でデータベース化を完了できたのは1841年度版の『第7年次報告書』までであった。前年度までの進捗状況に照らして、最終年度はさしあたり救貧法委員会『年次報告書』の残り7年度分に限定してデータベース化を進めた。データの入力は、前年度中に開発した方法によったが、年度前半が終了した時点で4年度分がまだ手つかずであったことから、さらなる絞り込みが必要と判断し、ユニオンごとの統計表をデータベース化の対象から外した。以上のような数次の方針変更により、救貧法委員会『年次報告書』付録統計資料のデータベースは年度末までに一応の完成を見たが、その本格的な分析には取りかかれなかった。ただし、当該のデータベースは、いまだ「電子化データ」レベルのものであり、汎用型で利便性の高いシステムに改変するための機会を今後求めていきたい。
すべて 2005
すべて 雑誌論文 (4件) 図書 (1件)
福井工業高等専門学校 研究紀要 第39号
ページ: 131-144
歴史読本(新人物往来社) 第50巻1号
ページ: 212-219
Research Reports of Fukui National College of Technology no.39
Rekishi-dokuhon(Shin-Jinbutsuorai-sha) vol.50, no.1