研究概要 |
1.データ形式の改善 前年度までの研究で既に明らかにしたように、「玉塵抄」のように豊富に他の典拠を引用する注釈文献の場合は、引用開始・終了の階層構造は、必ずしも常に整然と秩序だっている訳ではない。従って、SGML(ISO/IEC8879,JIS X4151)のような、破綻のない階層構造を仮定したデータモデルは、そのまま適用可能ではない。 この為、ゆるやかな階層構造を仮定し、それからの逸脱を許容する形に、データ形式を改善した。 2.TEI規格の検討 汎用テキストデータ記述規格として、TEI(Text encoding initiative)第三原案(TEI-P3)が今年度出版されたので、これを検討した。この結果、読み列と表記列、注釈・被注釈関係を持つデータ構造にはまだ非力な面がある事から、TEI-P3の採用は見送る事とした。尚、10月にTEIの推進メンバが来日したため、本研究に基づく発表を行ない、併せてTEIとの親和性に就て若干の討論を行う事ができた。 3.本文整形支援用ソフトウェアの開発 既に入力済の巻を、上記のようなデータ形式へ変換し、今後入力を進める巻の検証(data validation)を行う為のソフトウェアをPerlで開発した。尚、パーソナルコンピュータの能力向上が著しいので、今後のソフトウェアには、基本的にPerl言語を用いる事で十分と決した。 4.本文入力の進行 新たに手書き漢字入力機を使用し、巻九の補遺及び巻三の新規入力を行なった。
|