本研究では近代文語文の形態素解析を行うための電子化辞書「近代文語UniDic」を作成し、日本語研究者に利用しやすい形にまとめ上げてインターネット上で一般公開を行った。この辞書は「現代日本語書き言葉均衡コーパス」の開発に用いられているUniDic をベースにしており、斉一な単位・階層化された見出し語などの設計を受け継いだ、言語研究に適した辞書となっている。また、近代文語UniDic は現代語用のUniDic と見出し語の互換性があるため、近代語と現代語の比較研究に利用することが可能となった。 この形態素解析辞書の応用として、この辞書で『太陽コーパス』を解析した結果を用いて語彙頻度表を作成し、コーパス言語学的手法による近代語語彙の記述的研究を行った。また、これを『現代日本語書き言葉均衡コーパス』(モニター版)を現代語版のUniDic で解析した結果と比較することにより、近代語と現代語の語彙の比較研究を行った。 これらの研究成果については研究成果報告書『近代文語文を対象とした形態素解析のための電子化辞書の作成とその活用』(全233 ページ)にまとめ、公開した。
|