研究課題/領域番号 |
08207231
|
研究機関 | 帝塚山大学 |
研究代表者 |
川口 洋 帝塚山大学, 経済学部, 助教授 (80224749)
|
研究分担者 |
上原 邦彦 帝塚山大学, 経済学部, 助教授 (10232779)
上島 紳一 関西大学, 総合情報学部, 教授 (10184920)
|
キーワード | 画像デ-ベース / 古文書文字認識 / 人口 / 江戸時代 / 宗門改帳 |
研究概要 |
本研究では、17世紀末から19世紀中期までの期間に、原則として集落単位に毎年作成されていた「宗門改帳(しゅうもんあらためちょう)」と総称されていた古文書を原史料として、史料読解から人口学的指標算出に至る研究過程をできるかぎり自動化する人口分析システムの構築を目標としている。 本年度は、人口分析システムを開発するための第1段階として、陸奥国会津郡小松川村(現在は、福島県南会津郡下郷村に所属する。)の「宗門家別人別改書上帳」(寛政4(1792)年から慶応2(1866)年)を入力史料として、「宗門改帳」古文書画像データベースを構築した。本データベースは、マイクロソフト社のACCESSをDBMSとして構築されている。ア)個人情報(データ数:7148)、イ)世帯情報(データ数:1724)、ウ)古文書画像情報(データ数:1724)、エ)史料書誌情報(データ数:75)の4つのテーブルから構成されている。利用者は、ア)、イ)の文字データとウ)の古文書画像データを、同一画面上で検索、表示することができる。したがって、データベース利用者が、文字データに誤読の疑いを抱いた場合、あるいは原史料の文字のレイアウト、筆跡、印形といった文字データとして登録することのできない画像情報を参照したい場合にも、データベース構築者の研究過程を再現、批判できる環境を整備することができた。 さらに、史料読解から文字データ入力までの作業過程の効率化を図るために、年齢を表記した漢数字を対象として、古文書文字の自動認識に関する実験を開始した。3層のニューラルネットのバックプロパゲーション法を用いて、16種類の古文書文字(一、壱、二、弐、三、参、四、五、六、七、八、九、十、拾、廿、ツ)を学習させ、「宗門改帳」古文書画像データベースから152文字を採字して、判別実験を行った。認識率は、約34%であった。
|