本研究は、基礎データとして「昭和天皇実録」を用い、そこから情報の抽出・加工をおこなうことで、天皇を頂点とする権威的秩序と共に明治期から戦後まで続いた寡頭政の変遷を分析することを目的とする。この研究において、(a)「昭和天皇実録」から、拝謁者等の氏名・肩書を抽出する作業をおこない、拝謁回数の変遷を可視化した。さらに、(b)関連資料の整備もおこなった。 (a)について、まず、宮内庁から入手したデータからテキストデータを作成し、日付などの形式的に判断できる基本構造についてマークアップをおこなった。次に、拝謁者等の氏名・肩書の抽出をおこなった。「昭和天皇実録」のテキスト量は約860万文字あり、ここからからすべて手作業でマークアップすることは困難であるし、見落としや主観が入る余地が大きい。そこで、統計的手法を用いて予め機械にマークアップをさせた上で、それを人がチェックするという方法をとった。その結果、44322種類の肩書と人名のセットを抽出することができた。この中では、同一人物であっても肩書が異なる場合には別々に扱っているため、これをどのように処理するかが今後の課題である。 上記の結果から、出現回数の多い肩書を見ると、親王、内大臣、宮内大臣が上位に来ることがわかった。また、1941~1944年の期間について、人物ごとに月ごとの拝謁回数をグラフ化したところ、歴史的事件との相関関係が見いだせる可能性が高いことがわかった。詳細な検討は、今後の課題とする。 (b)について、『法律新聞』のデータ整備をおこなった。申請書中では、他にもいくつかの関連資料を挙げたが、『法律新聞』についてはテキストデータを入手したため、このデータの整備に集中することにした。その結果、検索データベースを完成させることができた。このデータベースは、1年以内に一般公開することを予定している。
|