研究概要 |
本研究課題では,日本語と英語という二ヶ国語間のコロケーションをコーパス言語学的手法によって分析し,コロケーション使用における両言語の共通性や相異点などを浮き彫りにすることを目的とする。具体的には,日英の各コーパスからコロケーションを抽出し,日本語及び英語における頻出コロケーションを解明すると共に,語彙的・統語的基準によって日英コロケーションにおける対応・非対応関係を検証する。成果の一つとして,日本人英語学習者に有用となる,日英対応コロケーションリストを構築する。 前年度では,日英の各言語別にコロケーションを抽出していたため,日本語コーパスから抽出された日本語コロケーションと,英語コーパスから抽出された英語コロケーションが互いに独立しており,両者をどのような方法で紐付け,比較分析するべきかが課題となっていた。意味的に対応するコロケーションの比較が最終的な目的であったが,そもそも意味的に対応するコロケーションをコーパスから探し出すこと自体に大幅なコストがかかっていた。そこで,平成23年度では,パラレルコーパス(翻訳コーパス)を活用し,意味的に対応する日英コロケーションを機械的に抽出する手法に取り組んだ。これは,翻訳文上に各日英コロケーションが同時に発生する確率と,個別言語上に独立して発生する確率に基づいて両者の類似度を算出するという方法であり,80%以上の正解率で対訳コロケーションが抽出される結果となった。 これにより,意味的に対応する日英コロケーションが効率的に抽出され,それらの対応性や非対応性を検証することが容易となった。
|