平成9年度は記述的方法を用いて論理構造を明示する文型の類型化と確定を行った。記述的方法とは、まず文章を収集し自然言語処理の手法を用いて各文章中の文型の使用頻度を求める。次に文型の意味用法から文型のグループ化を行った上で統計的手法を用いて分析を行い、その分析結果から文型の類型化を進めるという方法である。 専門家(経済学者、経営学者、社会学者)の文章から抽出した文型を基本資料に、自然言語処理の観点から検索システムのプログラムを開発し、それを利用して文章中の文型(単文型・文末文型・節末文型のほか複合助詞・接続詞も含む:約120文型)の使用頻度を求めた。ジャンルとしてまず選択したのは、基本資料の抽出元である教科書、明示的な論理構造を持つことが少ないと考えられる小説、さらに新聞社説の三つである。判別分析、クロス集計等の統計的手法を用いて分析した結果、文型という観点からジャンルの異なる文章構造の差異を明示する可能性が確認された。また論理構造を明示する文型の類型化の過程で、特に専門分野(経済学)において、文型を用いるかわりに漢語語彙で同様の意味を表現する場合が見られ(例:「AをBとすれば」のかわりに「AをBと仮定して」で表現する等)、論理展開に関わる漢語語彙の存在も分析の際に考慮する必要があることが分かった。今後は収集した理工学分野の論文についても記述的手法を用いて分析を行い、論述文を支えている主要文型を選定していく予定である。
|