• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

英語コーパスのパソコンによる文章解析

研究課題

研究課題/領域番号 06710323
研究種目

奨励研究(A)

配分区分補助金
研究分野 言語学・音声学
研究機関豊田工業高等専門学校

研究代表者

高橋 薫  豊田工業高等専門学校, 一般学科, 助教授 (90216705)

研究期間 (年度) 1994
研究課題ステータス 完了 (1994年度)
配分額 *注記
900千円 (直接経費: 900千円)
1994年度: 900千円 (直接経費: 900千円)
キーワードコーパス / タグ / 多変量解析 / 数量化III類
研究概要

今回入手したICAME Corpus collectionの中の、特にLOB Corpusについてパソコンによる英語文章の解析を進めた。
研究成果としては、以下のとおりである。
多変量統計解析法を用いることによって、LOB Corpusのタグの接続状況に注目し、カテゴリー(論述文、小説等の文章区分のこと)間にどのような文体的特徴の差異が現れるのかを分析して、文法範疇標示コーパスの有用性について明らかにするものであった。その結果を簡単にまとめると、動詞と接続する品詞との関係が文体の特徴を如実に示すことが明かとなった。すなわち、論述傾向の文章表現では述部の内容の複雑さが特徴であるといえるが、物語傾向の文章表現では比較的簡単な動詞と副詞辞による動詞句の表現が多い。特に物語文中での過去形はより単純で文末に置かれるか、副詞が伴うといった特徴をなす。また、be動詞(is)でも論述文では受動態に代表される複雑な文章形態であり、補語の構文も多いが、同名詞の補語あるいは進行形は物語文の特徴である。また、前置詞が接続する場合について差異は現れず、むしろ前置詞の目的語の部分に不定冠詞や所有限定詞が多いのが物語文の特徴といえる。名詞との接続では、論述文がより複雑な文章形態であるという一般的傾向として、前置詞句や過去分詞による限定的用法が多いが、固有名詞にはその傾向はないということが数値的に明確になり、このように高度な統計処理を活用する有効性が示された。

報告書

(1件)
  • 1994 実績報告書
  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 古橋聰・高橋薫: "LOB-Corpusにおけるカテゴリーの特徴について-多変量統計解析法による分析-" 中京大学 教養論叢. 35巻-3号. 123-143 (1995)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 高橋薫・古橋聰: "文法範疇標示コーパスにおける文体的特徴の推測" 英語コーパス研究会紀要. 2. (1995)

    • 関連する報告書
      1994 実績報告書

URL: 

公開日: 1994-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi