1996 Fiscal Year Annual Research Report
日本中世古文書フルテキストデータベースの構築方法に関する研究
Project/Area Number |
06401021
|
Research Institution | The University of Tokyo |
Principal Investigator |
保立 道久 東京大学, 史料編纂所, 教授 (70092327)
|
Co-Investigator(Kenkyū-buntansha) |
高橋 慎一郎 東京大学, 史料編纂所, 助手 (10242158)
山口 英男 東京大学, 史料編纂所, 助教授 (40182456)
横山 伊徳 東京大学, 史料編纂所, 助教授 (90143536)
近藤 茂一 東京大学, 史料編纂所, 助教授 (90153717)
加藤 友康 東京大学, 史料編纂所, 教授 (00114439)
|
Keywords | 古文書 / 古記録 / フルテキスト / KWIC検索 / ハイパーテキスト / 史料 / 史料集 / 歴史語集 |
Research Abstract |
本年度は、古記録フルテキストとのシステム関係の処理、ハイパーテキスト方式による東大寺文書・真珠庵文書などの全文フルテキストの蓄積などで予算を使用し、所期の成果を収めた。しかし、本年度の最大の成果は、これまで開発してきたシステムを前提として、史料編纂所編纂の『大日本古記録』(岩波書店発行)の内、『貞信公記』『九暦』『小右記』『御堂関白記』『後二条師通記』の5点、『平安遺文』(竹内理三氏編纂、東京堂出版発行)のフルテキストデータをインターネット上で公開したことである(97年2月から3月)。これによって、(古文書のみでなく古記録をふくめて)平安時代の歴史史料の基本部分を全世界から簡便に検索することが可能となった。この過程で特に問題であったのは、版権をゆうする出版社との折衝であったが、インターネットブラウザ上で、任意のキーワードを中心に前後各約10字のみを公開し、全文情報については別途の協議事項とするという形で合意をうることができた。本グループが開発したKWIC(キーワードインコンテキスト)方式、あるいはいわゆるコンコーダンス方式の検索は、あくまでもフルテキストデータの学術的大量処理と公開のために構想されたものであるが、それが現状のコンピュータ文化の中で、版権者の権利に対する技術的配慮の側面でも有効性をもつことになったのは、その必要性や当否は別として意外な結果であった。なお、『平板遺文』のテキストの最終校正などの問題は、科研グループの手を離し、版権者などの努力で、97年度中にも、フルテキストを収めたCD-ROMが発売される予定である。 なお、今後の問題は、印刷史料集の文字列のハイパーテキスト化を媒介とした簡便なデータベース化の標準的方法を確立することにあり、本年度は、(上記以外に)それを展望して『大日本史料』の藤原道長伝(活字版面約150ページ)をハイパーテキスト方式で実験的に入力した。
|