研究概要 |
本研究では,コーパス言語学において伝統的な「数語以内の位置で生起する単語をコロケーションと見なす」という素朴な手法の問題点を指摘し,統語解析技術を利用したより高精度なコロケーション抽出手法を提案した。これにより,キーワードと直接的な統語関係を有する単語のみをコロケーションとして抽出することが可能となった。当該手法を利用することで,大規模な英語コーパスからそこに生起するコロケーションが網羅的に抽出された。すべてのコロケーションから特に高頻度で使用される項目を選定し,効率的な英語コロケーション学習のためのコロケーションリストを構築した。
|