研究概要 |
本研究では、日本語の「書き言葉らしさ・話し言葉らしさ」の計測方法を設計するため、(1)英語研究などで用いられている既存の計測方法を用いた「書き言葉らしさ・話し言葉らしさ」の測定、(2)既存の計測方法の評価及び問題点の整理(言語学的分析・統計的検証)、(3)有効な計測方法の設計、及び、論文発表やWebによる発信の手順で研究を行う予定である。 平成21年度は、(1)英語研究などで用いられている既存の計測方法を用いた「書き言葉らしさ・話し言葉らしさ」の測定、を行った。英語の研究で用いられている計測方法を用いて『現代日本語書き言葉均衡コーパス』に収録予定のサンプルの「書き言葉らしさ・話し言葉らしさ」の計測を行った。具体的には、選択体系機能言語理論で用いられているLexical Density(語彙密度)という指標を用いてコーパスに含まれるテクスト(約65,000,000語)の語彙密度を計測した。 また、読み手がどのような言語的特徴によってあるテクストを書き言葉らしい・話し言葉らしいと評価するのかを調べるため、テクストを被験者に評定してもらい、書き言葉らしいと評価されたテクストと話し言葉らしいと評価されたテクストに対してRhetorical Unit Analysis(修辞ユニット分析)を行い比較した。結果として、語彙的な違いだけでなく、テンスや主語の種類など、文法的要因も強く影響していることが明らかになった。 さらに、Lexical Densityの「書き言葉らしさ・話し言葉らしさ」の指標としての有用性について確認するため、英語のコーパスにて検証を行った。
|