2002 Fiscal Year Annual Research Report
応用言語学的視点による英語コーパスのテキストジャンルに関する類型論の再考
Project/Area Number |
13610674
|
Research Institution | Toyota National College of Technology |
Principal Investigator |
高橋 薫 豊田工業高等専門学校, 一般学科, 助教授 (90216705)
|
Co-Investigator(Kenkyū-buntansha) |
山下 淳子 名古屋大学, 言語文化部, 助教授 (00220335)
伊藤 彰浩 愛知学院大学, 教養部, 助教授 (60319184)
|
Keywords | The British National Corpus / 多変量統計解析法 / タグ / 文章類型論 / 文長 / 文章難易度 / 社会階層 / サブコーポラ |
Research Abstract |
約1億語からなる大規模英語コーパス、The British National Corpusのタグ情報とテキスト情報に基づくタグ頻度の基本的データを効率よく集計するソフトウエアーの開発がほぼ完了した昨年度に続き、本年度は数量化三類を用いて、テキストに付加された社会的条件により分類したサブコーポラについて以下の観点から分析をおこなった。 社会条件により分類したスピーチコミュニティーのタグの頻度に注目して数量化三類の分析を行った結果、主たる尺度として現れるのは、「物語的文章型」対「論述的文章型」、統語的に構造が「単純」「複雑」といった言語学的な解釈であった。 The British National Corpusに付加された、(知覚させる)文章難易度の指標と照らし合わせた結果、この尺度と高い相関を示した。すなわち、文章の難易度を測る指標としての妥当性が明らかになっため、応用言語学における言語習得の観点から、文章の難易度に影響する具体的な要因について統語のみならず語彙の面からも考察する足がかりとなった。 次に、社会言語学的な見地として、社会階層のレベルが文章の高度さ単純さと密接な関係を持つであろうという仮説を基に、The British National Corpusにある社会階層に関する分類変数により、数量化三類を用いて解析を行った。これにより、The British National Corpusのこの分類変数が統計的にも適切な指標であることが判明した。今後(知覚させる)文章難易度の指標と同様に、どのような言語学的な要因がサブコーポラを規定するのかを見出し、文章類型論の新たな展開としたい。
|
-
[Publications] TAKAHASHI, Kaoru: "Text Typology in English Corpora : Multi-Feature and Multi-Dimensional Analyses"The Institute of Statistical Mathematics Cooperative Research Report. No.162. 1-84 (2003)
-
[Publications] TAKAHASHI, Kaoru: "A Study of Text Types and Register Variation in the British National Corpus (proceedings)"Corpus Linguistics 2003. 1-7 (2003)
-
[Publications] YAMASHITA, Junko, ITO, Akihiro: "What does a corpus tell us about judgements about text difficulty? : An analysis of perceived level of difficulty in the British National Corpus"English Corpus Studies. No.10. 1-17 (2003)