2001 Fiscal Year Annual Research Report
応用言語学的視点による英語コーパスのテキストジャンルに関する類型論の再考
Project/Area Number |
13610674
|
Research Institution | Toyota National College of Technology |
Principal Investigator |
高橋 薫 豊田工業高等専門学校, 一般学科, 助教授 (90216705)
|
Co-Investigator(Kenkyū-buntansha) |
山下 淳子 名古屋大学, 言語文化部, 助教授 (00220335)
伊藤 彰浩 愛知学院大学, 教養部, 講師 (60319184)
|
Keywords | The British National Corpus / 数量化三類 / タグ / テキストタイポロジー / 文長 / 文章難易度 |
Research Abstract |
本年度は大規模英語コーパスであるThe British National Corpusのタグ情報とテキスト情報に基づく基本的な統計データを求めることにかなりの手間を要した。特に1億語という単語量の解析をいかに効率的に行うかという点では、既存のコンコーダンスソフトに依存することなくCプログラミングで独自のツールを開発し、基本データをエクセルのスプレッドシート上に乗せることにより、さまざまな言語変数の組み合わせに対応した頻度データをほぼ瞬時に取り入れることができる環境の開発に成功した。 また、多変量統計解析法の一種である数量化二類のソフトウエアーの改良を行い、Windows上での解析を可能とした。 このように初期段階の研究準備が整いつつあるなか、専ら研究は、応用言語学的な見地からコーパスをどう生かすかという観点で議論を進めている。 まず、テキストの難易度という観点から、すでにテキストタイポロジーの研究で得られた文章類型の言語学的尺度である「物詰的文章型」対「論述的文章型」、統語的に構造が「単純」「複雑」、さらに時制軸といった観点がテキストの難易度とどう関わるかが研究テーマとなる。 現在のところ、「物語的文章型」対「論述的文章型」という尺度と応用言語学におけるテキストの難易度に関する視点においては、文長という観点から共通性がみられることが明らかになった。 現在、さらに文の複雑さを決定する要因を関係節に注目している。具体的には、関係節の難度決定要因としての枝型と名詞句の種類に着目し、どの枝型および名詞の役割が英語関係節の産出における難度を高める傾向があるのかをThe British National Corpusより明らかにしようとしている。
|