本研究は、『日本語歴史コーパス』(CHJ)から取得した多様な資料にみられる語の連続について、通時的かつ計量的に明らかにするものである。CHJから抽出されたN-gramデータに文法および意味用法に関する情報を付与した。同時に、N-gramの使用状況の資料間の共通度も比較・検討した。口語資料においては共通した複合辞や引用表現が多用されていること、待遇表現や語りの定型的表現等においてそれぞれの資料性が強くあらわれること等を明らかにした。さらに、語の連続という観点から日本語のモダリティ表現の通時的変化を検討した。
|