研究課題
基盤研究(C)
本研究でめざしたものは、英文テキストの特性をその語彙をもとに特定する手法の開発である。テキストの性質はさまざまな要因が複合的にかかわるもので、その特性をひとつの指標で算出しようとすることは現実的でない。そこで、語彙の難易度、ジャンル、スピーチ・レベルなど個々の特性ごとに、それらの特性をプロファイルとして一覧表の形で提示し、判定はそれをもとに行う方法を案出した。書きことばではBrown Corpusをもとにジャンル別に語彙一覧を算出し、ジャンルごとの集合、補集合をとり、そこに特徴的に現れる語彙を特定した。これをFrown Corpusで検証したところ、高い信頼度でジャンルを特定することができた。しかし、同じジャンルであっても話題により語彙の分布が大きく変動することも明らかになった。また、語彙にかかわっては文長、とりわけT-unitとよばれる単位での語数がテキストの性質に深くかかわっていることがあきらかとなった。とりわけ、小説では作品のなかでの文長の差が大きく、作家が意図のもとに文長を統御していることがうかがわれた。これは登場人物の心理描写にかかわって用いられることが多いようだ。話しことばと書きことばの区別では、話しことばの特徴として定型表現の多用、また、フライングとよばれる言い直しの多用が特徴的であった。英語を外国語として学んでいる学習者の英語と母語話者の英語を比べてみると、学習者の英語は書きことばでも話しことばでもテキストの性質は差が小さかった。すなわち、書きことばと話しことばが未分化の状態である様子があきらかとなった。
すべて 2007
すべて 雑誌論文 (2件) 学会発表 (2件)
立命館言語文化研究 第18巻4号
ページ: 66-77
Ritsumeikan Studies in Language and Culture Vol.18, No.4