研究成果の概要 |
学術的な文章の言語資源(コーパス)から言語特徴抽出を行い、ライティング教育の学習コンテンツとして提供することを目的に推進し、本研究においては以下の3点の主な成果を得た。 (1) XMLコーパスである現代日本語書き言葉均衡コーパス(BCCWJ)の高校教科書データを対象に解析し、用いられている動詞・名詞の頻度情報を得た。(2)平文テキストデータに長単位形態素情報を付与するためのソフトウェアComainuを利用し、学術文・技術文データの処理手順の開発と処理作業を行った。(3)学術文(約6,000字)、技術文(約15,000字)から情報抽出し、長単位動詞・名詞の頻度データを得た。
|