本研究では、近年構築が盛んな日本語コーパスを積極的に活用して、コーパス言語学が得意とする、大規模データとコンピュータを用いた計量分析を行い、日本語の文章中で使われる語彙の相互関係を分析していく。上記の方法論的視座に基づく研究を通して、使用された語彙が文章の構造や形成プロセスにどのように作用しているのかという語彙論と文章論にまたがる問題を明らかにする。 研究最終年度である平成30年度は、文章として実現されたコーパス内の語彙のうち、従来の研究でも盛んに論じられてきた品詞という側面から見たときの相互関係を分析対象とし、大規模データによる探索的な計量分析によりその実態を詳らかにした。具体的には、以下の研究を行い、公表した。 ・「樺島の法則」と呼ばれる、延べ語数における品詞構成比率の変動パターンを踏まえ、資料と品詞の種類に関する量的な充実を図りつつ再度の検討を行い、「樺島の法則」の変動パターンに関する精緻化を行った。分析資料には国立国語研究所(2015)『現代日本語書き言葉均衡コーパス』(Version 1.1 DVD版)に収録された「出版サブコーパス」のうちの「書籍」を選び、文書ごとの品詞構成比率を計算して並べ、品詞構成比率の変動を調査した。それにより、従来の「樺島の法則」と異なる以下の結果が得られた。 a. 動詞・形容詞・副詞 (・助動詞・代名詞):一定の割合で減少 / b. 形状詞・連体詞(・助詞):増加→減少 / c. 接続詞:減少→緩やかな増加ないし維持→減少 / d. 感動詞:急激な減少 また、上記の変動と文章のジャンルとの対応関係を調べたところ、名詞の増加に社会科学、自然科学、技術・工学の増加が対応し、動詞等の減少に文学と哲学の減少が対応し、形状詞等の増減に歴史と芸術・美術の増減が対応することが分かった。 以上の調査結果から、文章と語彙の相互関係の一端が明らかになったと言える。
|