研究概要 |
書き言葉を多角的に分類するための基本的な尺度を,コーパスに基づく探索的研究を通して構築することを目標に,21年度は次の3つを実施した. (1)評定実験の実施: A)評定語の選出:先行研究を参考に文体や文章分類に関する指標・評定語を抽出し,整理した. B)予備調査:2回の予備実験を通して,本実験で利用する評定語対を選別し,評定対象とするテキストの種類や分量を決定した.また予備調査を踏まえ,評定作業者用のマニュアルを作成した. C)本調査の実施:8月上旬から10月にかけて本調査を実施した.『現代日本語書き言葉均衡コーパス』より,テーマを社会に限定して300のサンプル(各サンプル500文字)を抽出し,それを対象に評定者3名により8つの評定語対(例:改まった・くだけた,客観的・主観的)にもとづき評定を実施した. (2)研究用情報付与:評定実験に用いた300の文章サンプルを対象に,分析に用いる情報として,文境界情報,品詞情報,語種情報を付与した. (3)評定結果の分析:評定実験の結果を対象に,評定語間の相関関係や評定者間の一致度などについて検討し,調査の妥当性や問題点などについて検討した.また,品詞・語種・文特徴(文末文体など)と各評定語との関係についても予備的に調査した. 従来の文章分類の研究は,体系化自体が自己目的化することが少なくなかったが,本研究では,実際に人手で評定値を付与したデータを作成し,それに基づき基本的尺度を求める手法をとる点に特徴があるといえる.
|