本研究では明治20年代に発表された言文一致体翻訳小説(6作品)のコーパス構築を行った。構築したコーパスには、形態素情報・文節情報・係り受け情報・節情報を付与した。当該資料が翻訳される過程はいわゆる「言文一致体」の創始に影響を与え、近代口語体の確立にいたる過程で重要な役割を果たしたと考えられる。そこで言文一致体翻訳小説の文体に着目し、形態素情報をもとに統計的な分析を行った。比較には明治末期から大正期に【創作】された長編小説と短編小説を用いた。その結果、形態素情報レベルのn-gramは近似の値を示すという結果が得られた。一方で、接続助詞を指標とした一文中の連用節数では、言文一致体翻訳小説には非常に長い文が数文出現し、それら数文が全体を特徴づけていることがわかった。
|