2000 Fiscal Year Annual Research Report
国文学電子化テキストの異本同定プロトコルに関する研究
Project/Area Number |
10308013
|
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
安永 尚志 国文学研究資料館, 研究情報部, 教授 (20017411)
|
Co-Investigator(Kenkyū-buntansha) |
丸山 勝巳 国立情報学研究所, ソフトウェア研究系, 教授 (60280533)
中村 康夫 国文学研究資料館, 研究情報部, 助教授 (60144680)
原 正一郎 国文学研究資料館, 研究情報部, 助教授 (50218616)
ANDREW Armour 慶應義塾大学, 文学部, 教授 (20202799)
大山 敬三 国立情報学研究所, 実証研究センター, 教授 (90177022)
|
Keywords | 本文データベース / 異本同定 / 電子化テキスト / 古典テキスト / TEI / TEIヘッダ / SGML / フルテキスト |
Research Abstract |
インターネットの爆発的普及により,電子化テキストの複製が加速し,様々な課題を生み出している。とくに,1つの作品に対して数多くの異テキストが生み出され,電子化テキストの氏素性を確かめることが困難になってきている。氏素性の不確かなものは学術研究には使えない。すなわち,作品テキストの典拠(Authentication)が不可欠である。古典文学作品の電子化テキストを同定するための試みとして,TEIヘッダの記述を拡張し,かつ通信システム環境で異本の同定を制御するプロトコルを考えている。 策定した研究計画に従って,研究を実施した。まず国文学研究資料館設置の新しい超高速ギガビットイーサネットによるLANや超高性能基本サーバなどの情報システム環境の応用によるシステム確立を図った。 1.日本古典文学本文データベースから散文(源氏物語など)を中心とする作品を選び,詳細なDTDをTEI(SGML)により,検討した。TEIヘッダによる諸本同定情報の種類,記述方式の検討を行った。テキスト系譜の情報構造を把握するための作品の系譜モデルを検討した。 2.系譜モデルに基づく異本同定のための方法についての研究を行った。すなわち,(A)通信システム環境におけるプロトコルとして実装する,(B)WWWを想定した認証システム方式による,(C)TEIヘッダの拡張による記述仕様によるケースである。 3.TEIは国際標準である。TEIヘッダの機能追加や拡張については,TEIの推進母体である欧米の研究機関,研究者との密接な連絡調整を行った。
|
-
[Publications] H.Yasunaga,S.Hara et al: "Academic Digital Library and Contents in Japan"J.ALLC. Vol.14 No.1. 131-145 (1999)
-
[Publications] 安永尚志: "日本文学研究とコンピュータ"文学. 2000年7.8月号. 85-93 (2000)
-
[Publications] S.Hara: "OCR for CJK Classical Text"Proc.PNC/ECAI 2000. 93-110 (2000)
-
[Publications] 安永尚志: "国文学研究とコンピュータ"勉誠社. 498 (1998)
-
[Publications] 安永尚志: "テキスト処理"尚学社. 242 (1998)