Project/Area Number |
06710323
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
言語学・音声学
|
Research Institution | Toyota National College of Technology |
Principal Investigator |
高橋 薫 豊田工業高等専門学校, 一般学科, 助教授 (90216705)
|
Project Period (FY) |
1994
|
Project Status |
Completed (Fiscal Year 1994)
|
Budget Amount *help |
¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 1994: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | コーパス / タグ / 多変量解析 / 数量化III類 |
Research Abstract |
今回入手したICAME Corpus collectionの中の、特にLOB Corpusについてパソコンによる英語文章の解析を進めた。 研究成果としては、以下のとおりである。 多変量統計解析法を用いることによって、LOB Corpusのタグの接続状況に注目し、カテゴリー(論述文、小説等の文章区分のこと)間にどのような文体的特徴の差異が現れるのかを分析して、文法範疇標示コーパスの有用性について明らかにするものであった。その結果を簡単にまとめると、動詞と接続する品詞との関係が文体の特徴を如実に示すことが明かとなった。すなわち、論述傾向の文章表現では述部の内容の複雑さが特徴であるといえるが、物語傾向の文章表現では比較的簡単な動詞と副詞辞による動詞句の表現が多い。特に物語文中での過去形はより単純で文末に置かれるか、副詞が伴うといった特徴をなす。また、be動詞(is)でも論述文では受動態に代表される複雑な文章形態であり、補語の構文も多いが、同名詞の補語あるいは進行形は物語文の特徴である。また、前置詞が接続する場合について差異は現れず、むしろ前置詞の目的語の部分に不定冠詞や所有限定詞が多いのが物語文の特徴といえる。名詞との接続では、論述文がより複雑な文章形態であるという一般的傾向として、前置詞句や過去分詞による限定的用法が多いが、固有名詞にはその傾向はないということが数値的に明確になり、このように高度な統計処理を活用する有効性が示された。
|