本研究は、日本古辞書の多様性・複雑性に対応できる翻刻階層モデルの構築によって、奈良時代から伝存する良質な日本の古写本古辞書文献資料を電子化し、さらにそのオープンアクセスを実現するための基礎研究である。 当年度においては、「古辞書翻刻階層モデル」を完成させた。「古辞書翻刻階層モデル」は、H4・H3・H2・H1・H0からなる5階層の文字モデルである。階層H4は原本の文字画像そのものであり、デジタル画像である。階層H3は、H4の画像を、できるだけ忠実に明朝体で起こしたものであり、いわゆるフォント字形にあたる。階層H2は、H3に対する「翻刻」字体であり、ここに「専門家」と呼ばれる「人」の解釈が入る。複数の解釈があり得ることから、一般にH2は、複数の字体の集合として記述される。階層H1は、H2とH3の近似化であり、H2の中でH3に近似できる字体を抽出する。階層H0は、H1に対する代表字であり、異体字レベルでの抽象化をおこなったものである。 また、この「古辞書翻刻階層モデル」を、実際に、日本の古辞書に適用し、その有効性を検討した。このモデルにより、「専門家」による「翻刻」の差が階層H2で可視化されると同時に、その差が決定的な矛盾を孕んでいるのか否かが、上下の階層で可視化される。これにより「翻刻」作業の過程が、部分的ではあるものの可視化され、それが校訂の精度を高める、ということが実証された。また、国際的文字コードであるUCS (Universal Coded Character Set、いわゆるUnicode)を、各階層のどの部分に適用すべきかの検討もおこなったが、これについては、どのような包摂規準を準備すべきかという問題とあいまって、明確な答は出なかった。
|