研究概要 |
1990年代半ば以降,コンピュータ技術の発達などにより,膨大な語数から成るコーパスが容易に利用できるようになった。大規模コーパスの利用により,これまでの手作業による研究では気付かれることのなかった言語事実が多数発掘されるようになってきた。コーパスの利用によって初めて本格的研究が可能となったのは,語と語の結び付きの強度(結合度)をも考慮に入れたコロケーション研究である。例えば,abundantly clear, a whole new wayは自然で,^*abundantly hot, ^*a whole cold dayは自然ではないことは,従来の研究でも明らかにされていたが,コーパスは,語と語の結び付きの強度を客観的な数値で示すことを初めて可能にした。このようなコロケーションの結合度を測る手法として,これまでMI-score (Mutual Information Score「相互情報量」)やt-scoreが提案されてきた。本研究では,コーパスを用いて,現代英語のコロケーション記述を詳細に行い,同時にその結び付きの強度(結合度)の測定方法を検討することを目的とした。研究に用いたコーパスは,The British National CorpusとThe Bank of Englishという現代英語における最大規模のコーパスである。 特に注意を払ったコロケーションは,-ly副詞と形容詞のコロケーションであり,実際に,MI-score, t-socreそして頻度を利用して,コーパスから有益なコロケーションを抽出し,併せて,これらの値の利用の仕方に関して検討した。 当初は語と語の共起関係に関心をもって研究を始めたが,研究途上で語と構文の共起関係にも注意が向くようになった。そこで本研究の一環として,「SOV構文」や「米語におけるhaven't NP」に頻出する語彙的パターンの同定を試みた。
|