1.東大本巻第六、八、十の入力。 「玉塵抄」の主要三写本のうち、校合のベースとして用いる東京大学国語研究室本の一部を、前年度同様に入力した。他巻に就ては、来年度に回した。 2.データ形式の洗練とSGML形式との連係 SGMLは、規格自体に文字コード関係に大きな欠点があり、特に漢字とその他の特殊記号を豊富に用いる我々のデータでは、厳密な運用が不可能である。 上記の結論は、既存のSGMLアプリケーションであるTEI及びHTMLの最新版の検討と、又、g-DTD(JIS素案)の方式の実装を試みた上で得たものであり、SGML専門家からも確認を得ている。 しかし、SGMLは、現在もっとも広く流通するマークアップ言語であるので、これを無視して独自の形式を策定するのは余りに無駄が多い。そこで、SGMLを実装用の下位表現として用いるための上位形式を策定し、SGMLを「低水準言語」として利用するためのトランスレータを実装して、間接的にSGML表現との連係を図る事とした。尚、これにより、印字出力のT_EX化も容易になった。 但し、外字問題が未解決であり、次年度の課題である。 3.索引の照合方法の洗練とJIS準拠 上記のデータ形式改訂に基づき、索引作成方法も変更した。又、所謂「五十音順」(語索引)「電話帳順」(漢字索引)に就ては、JIS X4051「日本語文字列照合順番」規格に基づいた実装を行なう事とし、日本語の特殊事情に特に配慮した。(関連論文、豊島)。
|