• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

英語コーパスのパソコンによる文章解析

Research Project

Project/Area Number 06710323
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field 言語学・音声学
Research InstitutionToyota National College of Technology

Principal Investigator

高橋 薫  豊田工業高等専門学校, 一般学科, 助教授 (90216705)

Project Period (FY) 1994
Project Status Completed (Fiscal Year 1994)
Budget Amount *help
¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 1994: ¥900,000 (Direct Cost: ¥900,000)
Keywordsコーパス / タグ / 多変量解析 / 数量化III類
Research Abstract

今回入手したICAME Corpus collectionの中の、特にLOB Corpusについてパソコンによる英語文章の解析を進めた。
研究成果としては、以下のとおりである。
多変量統計解析法を用いることによって、LOB Corpusのタグの接続状況に注目し、カテゴリー(論述文、小説等の文章区分のこと)間にどのような文体的特徴の差異が現れるのかを分析して、文法範疇標示コーパスの有用性について明らかにするものであった。その結果を簡単にまとめると、動詞と接続する品詞との関係が文体の特徴を如実に示すことが明かとなった。すなわち、論述傾向の文章表現では述部の内容の複雑さが特徴であるといえるが、物語傾向の文章表現では比較的簡単な動詞と副詞辞による動詞句の表現が多い。特に物語文中での過去形はより単純で文末に置かれるか、副詞が伴うといった特徴をなす。また、be動詞(is)でも論述文では受動態に代表される複雑な文章形態であり、補語の構文も多いが、同名詞の補語あるいは進行形は物語文の特徴である。また、前置詞が接続する場合について差異は現れず、むしろ前置詞の目的語の部分に不定冠詞や所有限定詞が多いのが物語文の特徴といえる。名詞との接続では、論述文がより複雑な文章形態であるという一般的傾向として、前置詞句や過去分詞による限定的用法が多いが、固有名詞にはその傾向はないということが数値的に明確になり、このように高度な統計処理を活用する有効性が示された。

Report

(1 results)
  • 1994 Annual Research Report
  • Research Products

    (2 results)

All Other

All Publications (2 results)

  • [Publications] 古橋聰・高橋薫: "LOB-Corpusにおけるカテゴリーの特徴について-多変量統計解析法による分析-" 中京大学 教養論叢. 35巻-3号. 123-143 (1995)

    • Related Report
      1994 Annual Research Report
  • [Publications] 高橋薫・古橋聰: "文法範疇標示コーパスにおける文体的特徴の推測" 英語コーパス研究会紀要. 2. (1995)

    • Related Report
      1994 Annual Research Report

URL: 

Published: 1994-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi