研究課題/領域番号 |
13610674
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
言語学・音声学
|
研究機関 | 豊田工業高等専門学校 |
研究代表者 |
高橋 薫 豊田工業高等専門学校, 一般学科, 助教授 (90216705)
|
研究分担者 |
伊藤 彰浩 愛知学院大学, 教養部, 助教授 (60319184)
山下 淳子 名古屋大学, 国際開発研究科, 助教授 (00220335)
|
研究期間 (年度) |
2001 – 2003
|
研究課題ステータス |
完了 (2003年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,600千円)
2003年度: 600千円 (直接経費: 600千円)
2002年度: 700千円 (直接経費: 700千円)
2001年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | The British National Corpus / 多変量統計解析法 / タグ / 文章類型論 / 文長 / 文章難易度 / 社会階層 / サブコーポラ / 数量化三類 / テキストタイポロジー |
研究概要 |
約1億語からなる大規模英語コーパス、The British National Corpusのタグ情報とテキスト情報に基づくタグ頻度の基本的データを効率よく集計するソフトウエアーの開発が初年度に完了し、2年目はデバックをしつつ、数量化三類を用いて、テキストに付加された社会的条件により分類したサブコーポラについて以下の観点から分析をおこなった。 社会条件により分類したスピーチコミュニティーのタグの頻度に注目して数量化三類の分析をおこない、「物語的文章型」対「論述的文章型」、統語的に構造が「単純」「複雑」といった尺度上での類型化が可能となった。また、(知覚される)文章難易度の指標と照らし合わせた結果、この尺度と高い相関を示した。すなわち、文章の難易度を測る指標としての妥当性が明らかになっため、応用言語学における言語習得の観点から、文章の難易度に影響する具体的な要因について統語のみならず語彙の面からの重要性を示唆するものであった。さらに3年目は、社会階層に関する分類変数によりサブコーポラを構築して、数量化三類を用いて解析を行った。これにより、社会階層を階層順に区分する第一因子が出現した。それを社会階層を規定する尺度とみなした。 さらに、この尺度は、さまざまな単語の関連から、文章がcasual, formalの程度を表す単語としてみなすことができた。
|