本研究の目的は、従来の和歌用語のシソーラス八代集対応版を、二十一代集(905年頃~1439年)対応版に拡張することである。代表者はこれまでに10年以上の歳月をかけて、和歌用の形態素解析辞書とシソーラス(語彙体系用語集)を開発してきた。形態素解析用の辞書は、25年度までの基盤研究Cで二十一代集対応版が完成しているが、シソーラス(さまざまな単語の表記を同一視するか、あるいは異なる意味を持つものか、他などを判定するための語彙一覧)については、二十一代集に対応できていなかった。本研究において、シソーラスの二十一代集対応版を完成させると共に、その開発を通して、和歌を基盤とする534年間におよぶ古代語の用語空間分析(語彙体系変遷)の理論化を試みた。 二十一代集テキストを単位分割したのち、プログラムt2cを用いて、一つ一つの単語に分類コードをつけていった。これまでは八代集までにしか対応していない辞書であったため、二十一代集にはじめて出てくる単語については未知語扱いとなっていた。そこで目視によってデータを確認し、未知語があればその単語の分類コードを決定した上で、辞書にデータの追加作業を行い、シソーラスを完成させた。 二十一代集シソーラスを作成しながら、八代集シソーラスを用いて、系列比較モデルを枠組みとして、任意の2時代の比較(差分)が果してシソーラスによって、可能であるかどうか、実験した。系列比較モデルは任意2つのテキストを比較し、用語を大きく3分類する方法である。このような枠組みを作ったのは、ことばの変化と内容の違いとを明確に区別し、言語変化にのみ注目できるようにしたものである。シソーラスを用い、テキスト間比較を行う実験を実施したところ、シソーラス開発上の問題点なのか、研究の枠組み上の問題点なのかが明らかになった。
|