本研究は、主に論述文を代表とする論文を分析対象とし、分野を超えた論文に共通する機能語句群を明らかにし、最終的には論述文に代表される文章の論理構造を明示する機能語句群を確定することを目標としている。今年度は、社会科学分野の中から経済学分野の論文を分析対象とし、従来の研究で用いてきた多変量解析の手法と統計学的モデルを用いて分析を行い、従来の研究結果と比較対照を行った。具体的な方法は次の通りである。 中・上級文型に含まれる機能語句(接続語句・助詞相当句)62の語句項目の文章中の各使用頻度を求め、一文当たりの頻度に換算した値を各語句項目の出現率とした。なお、出現率を調べるにあたっては、用字の差異、活用変化の形を同一視して同じ語句項目として扱い、全数調査を行った。次にそのデータを用いて多変量解析法による分析を行った。資料の大きさの差異は事前確率を用いて調整した。この方法により、経済学論文という論理構造が明示的な文章における機能語句が、同じく論理構造が明示的だと考えられる、物理学、工学、文学等の分野の論文とどの程度共通し、また、小説等の論理構造が非明示的だと考えられる文章における機能語句とどの程度異なるのかを明らかにした。その上で、論文(論述文)に必要不可欠な機能語句群の雛型を試みに選定した。 現在、データの数量化に当たって、自然言語処理の手法を用いて、形態素解析プログラムを応用した検索プログラムを開発し、大量データの数量化を迅速に行える方法を探っている。このプログラムの利用が可能となれば、文書資料について、今後、電子コーパスを積極的に活用できるようになり、分析時間の大幅な短縮が見込まれるため、分析結果の検証をより多くの文書資料で行えることが期待できる。
|