2010 Fiscal Year Annual Research Report
歴史知識情報の正規化による古記録フルテキストデータベース高度化と記録語の解析研究
Project/Area Number |
21320121
|
Research Institution | The University of Tokyo |
Principal Investigator |
吉田 早苗 東京大学, 史料編纂所, 教授 (00110693)
|
Co-Investigator(Kenkyū-buntansha) |
本郷 恵子 東京大学, 史料編纂所, 教授 (00195637)
尾上 陽介 東京大学, 史料編纂所, 准教授 (00242157)
|
Keywords | 古記録 / フルテキスト / 『貞信公記』 / 『九暦』 / 『深心院関白記』 / 中世記録人名索引 / 構造化テキスト生成システム / 翻刻支援システム |
Research Abstract |
イ)テキスト構造化による古記録フルテキストデータベースの高度化 古記録フルテキストデータベースに格納されたテキスト情報をもとに、歴史知識情報(人名・地名ほか各種語彙)の解析を行い、属性に応じた差異化の方法を検討した。これをもとに、先行してXML属性を有している編纂所データベース群との連携を視野に入れながら、公開促進費「古記録フルテキストデータベース」(研究代表者吉田)との協業により、新規データの作成・公開を行った(建内記・愚昧記など)。 (ロ)索引情報のデジタル化と知識情報の正規化による歴史知識論の構築 テキスト本文に付された人名・地名などの知識情報について、既刊史料集から索引情報を抽出し(猪熊関白記など)、データ解析・正規化を実践した。前年度に引き続き基盤研究(A)「ネットワーク環境における前近代日本史史料の翻刻・編纂フレームワークの確立」(研究代表者・加藤友康・明治大学教授、以下加藤科研)の協力をえて、メタ構造の確立を行うとともに、人名データについては史料編纂所歴史情報処理システム(SHIPS)上の「中世記録人名データベース」から公開した。なお地名など地理属性をもつデータについては、(A)「画像解析とフィールドワークに基づく荘園絵図情報システムの構築」(研究代表 高橋敏子・史料編纂所准教授)と共同にてジオタグの付与にむけた研究を進めた。 (ハ)電算印刷を前提とした古記録編纂システムの検討 編年体史料集『大日本史料』において実践されている編纂原稿のTex化を踏まえ、『大日本古記録』への対応を模索した。加藤科研が開発した「翻刻支援システム」を用いて記録史料のXML化を行い、版面体裁となるTex移行にむけたスタイルシートの開発に着手した。 (ニ)古記録編纂システムと古記録関連情報の連携 古記録編纂の基礎となる史料典拠情報の収集を継続して行うとともに、蓄積してきたデータとあわせて、SHIPS上の「編年史料カードデータベース」から公開に着手した。
|