本研究課題では,複数文からなるテキストPと,テキストPとは異なる言語で記述された単文Hの含意関係認識について検討した.最初に,Wikipedia の日英対訳コーパスを利用して,日英の言語横断単文含意関係コーパスの作成を行った.この方法では,含意関係にある文対は大量に収集することができたが,含意関係にない文対を収集する場合には,特に論理的な矛盾を含む文対の収集に難点があることを示した.加えて,論理的に矛盾を含む文対を収集する方法について,英語単言語大規模含意関係コーパスを対象とする分析を行い,クラウドソーシングを用いて仮説文を収集するという単純な方法には問題があることを明らかにした.
|