平成19年度は、二つの観点から研究を進めた。一つは、平成18年度に拡充、整備した小型の文章コーパスを対象とした複合動詞の使用頻度調査である。文章資料であるコーパスは、論文(物理学、工学、文学、経済学)、小説(近代小説、現代小説)、新聞社説という異なる7つのジャンルの350編の文章資料である。指標としての複合動詞は昨年度選定した41の動詞項目を用いた。41の後項動詞の項目は、「かける」「かかる」「はじめる」「だす」「でる」「まくる」「つづける」「おえる」「おわる」「つくす」「きる」「とおす」「ぬく」「はてる」「そこなう」「そんじる」「そびれる」「かねる」「おくれる」「わすれる」「のこす」「あやまる」「あぐねる」「そこねる」「すぎる」「なおす」「なおる」「つける」「つく」「なれる」「あきる」「あう」「あわせる」「あがる」「あげる」「こむ」「こめる」「いる」「いれる」「たつ」「たてる」である。現在、この使用頻度調査が終了したところである。 もう一つの観点は、方法論の検討である。本研究の多変量解析の適用については、これまで文型を指標とした文章ジャンルの判別の可否について判別分析法を用いて実証してきたことをもとに考えている。しかし、判別分析法ではデータの持つ情報の一部を使い、捨てる情報があることから、その情報も含めた分析法として新たに主成分分析の検討を行った結果、判別分析を裏付ける結果を得られた。今後は、複合動詞を指標とした文章のジャンル判別の可能性についてもこれらの方法を適用する予定である。
|