1、テキストデータの入力 まず書写者の異なる巻として、『玉塵抄』国会本の巻一、七を選び、朱引き、傍点等に至るまで記号化して、入力を行った。これは想像以上に雑な作業であり、特に朱引き(音合・訓合符を除く)は、巻七の途中で省略に従う事とした。 この入力の過程で、読みに関する様々な問題が生じたが、それらは、巻一と七の索引を作成した後、再検討し、読みを定めた。『玉塵抄』の各巻は、言語量としてもかなりのものであり、全55巻中わずかに二巻ではあるが、用例の帰納により、従来判然としなかった意義上の差異を明らかにし得たものがある。例「ウチ」と「ナカ」、「カミ・ウエ」と「シモ・シタ」、「コエ・ネ・オト」等である(いずれも詳しくは報告書を参照のこと)。 2、処理用ソフトウェアの開発 『玉塵抄』の様な複雑なデータを処理する為には、従来のソフトウェアでは不十分である。特にこれまでの索引作成用ソウトウェアは、テキストの線条性(linearity)を前提としているが、『玉塵抄』の様に、本行本文に振仮名が付され、さらにそれに朱点が施され、それが抹消され…といった複雑な構造や、一表記に二つ以上の読み(音と訓など)が与えられているものでは、線条性は満たされない。本研究で開発したソフトウェアは、テキストに「層」(strata)の概念を導入し、複数の層を並行して処理出来る様設計してあるので、この様な複雑な表記にも十分対応出来る。又、ソウトウェアはc言語で書き、パーソナルコンピュータ、ミニコン、大型機、何れでも動作する事を確認した。但し、本ソウトウェアも(従来のものと同様)継起性(sequentiality)(前後が逆にならない事)は前提としている為、漢文の処理等には未だ課題を残している。
|