本研究は、中国古典の文章をクラスター分析を用いて調査し、その基本的な文章の性格の相違を明らかにすることである。特に漢文特有の助字に注目し、その使用の相関から文章の近似性・相違性を検討してきた。 まず、同じ史書の性格を持つ『漢書』『後漢書』について、特に「本紀」の巻々における助字の相関を調査した。調査対象としたのは、それぞれ近い性格を持つ助字の「於」「于」、そして「焉」「矣」の合計4文字である。中でも、もっとも漢書・後漢書の両書の違いを示したのは、文末の助字「焉」「矣」の相関を比較した場合であった。具体的には『漢書』『後漢書』の本紀、あわせて25巻を、当該2文字の相関でクラスタリングし、仮に4つのグループ(A群~D群)に分けた場合、それぞれのグループに『漢書』の本紀が入っている割合を見ていくと、A群は4/4、B群は3/4、C群は2/6、D群は4/11となり、明らかにA群とB群に集中していることが分かる。逆に後漢書はB群に1例(1巻)入っている以外は、すべてC群かD群に分類されるという結果になった。このことから、当該2文字に注目した場合は、おおむね文字使用の相関から両書を分けることが可能であることが示唆された。 逆に「於」「于」の2文字では、両書の相違が明確には確認できなかった。具体的には、『漢書』『後漢書』両書の本紀を「於」「于」の2文字で分類し、5つのグループ(仮にⅠ群からⅤ群とする)に分けた際、Ⅱ群とⅣ群は、すべて後漢書で構成されたのに対し、Ⅰ群は9巻のうち『漢書』は4、『後漢書』は5に、Ⅴ群は10巻中『漢書』は7、『後漢書』は3と、必ずしも明確には区分されなかった。 上記結果から、クラスター分析により、異なる文章を用字の相関から区分することは不可能ではないと示唆された。しかし分析文字については、なお慎重に選ぶ必要があり、今後様々な文字でこの方法を試すことが求められる。
|