2009 Fiscal Year Annual Research Report
自然言語処理技術を利用した英語コロケーションリストの作成
Project/Area Number |
20720145
|
Research Institution | Osaka University |
Principal Investigator |
後藤 一章 Setsunan University, 外国語学部, 講師 (90397662)
|
Keywords | コロケーション / 自然言語処理 / コーパス / 統語解析(構文解析) / 英語教育 |
Research Abstract |
British National Corpusと呼ばれる1億語のコーパスから、前年度に確立したコロケーション抽出手法を活用し、コロケーション(共起語)を網羅的に抽出した。抽出したコロケーションの生起頻度を、British National Corpusに含まれる9種類のジャンル別に集計した。9種類のジャンルには「自然科学」や「創作散文」など幅広いジャンルが含まれており、頻度をジャンル別に計測することで、各コロケーションの使用幅(レンジ)が推定されることになる。っまり、多数のジャンルに共通して生起する項目は汎用的なコロケーションとして捉えられ、特定のジャンルに限定して生起する項目は専門的なコロケーションとして捉えられる。汎用的なコロケーションの例として、"answer+question"、"give+chance"、"have+effect"などが見出され、専門的なコロケーションとして"integrate+system"や"add+garlic"などが抽出された。こうして、生起頻度や使用幅の情報に準拠した、客観性の高い新規的なコロケーションリストが構築された。学習効率という観点からは、多様な文脈で使用可能な汎用性の高いコロケーションを優先的に学習することが望ましいが、これまで生起頻度や使用幅に焦点を当てて作成されたコロケーション学習リソースは存在しなかった。よって、実際的な英語運用能力の養成が期待される今日の英語教育関において、本コロケーションリストの果たす役割は極めて大きいと考える。最終的な成果物である当該コロケーションリストは、教育・研究用として無償で提供する。
|