研究概要 |
1.Webからの母語話者/非母語話者英語論文の大規模収集 前年度改良したWebからの英語論文収集システムにより,2ヶ月間で,usドメインから約6万,jpドメインから約2万の論文を収集した.これらから,昨年度までに開発した母語話者論文/非母語話者論文の判別器を用いて,約14,000編の母語話者論文と約3,100編の非母語話者論文を取り出した 2.母語話者コーパスを利用した作文支援システムの作成と評価 計画では,共起表現が自然か否かを判定するシステムを開発する予定であった.しかし,前年度の考察から,上記で構築できたコーパス(特に母語話者コーパス)の規模は,不自然さを判定するには十分ではないと考えられるため,代わりに,形容詞が名詞を修飾する構造の形容詞と名詞からなる共起表現の形容詞の適切な代替形容詞の候補を提示する作文支援システムを構築し,英語校正会社に依頼して作成した評価データを利用して性能評価を行い,実用化に向けた検討を行った 3.母語話者/非母語話者英語論文コーパスから得られる英語教育に有用な情報の抽出 (1)非母語話者に特徴的な品詞列の遷移を基に,その品詞列遷移に関与している文法項目を特定する方法について検討した (2)英語の名詞が両コーパスにおいてどのような統語構造で使用されているかを調査し,相違を分析した (3)両コーパスに見られる談話標識の分布の相違について調査した 4.コーパスから得られる2次的情報の公開に関する法的検討 コーパスより抽出される2次的情報の公開に関して,どのような情報であれば公開可能かを改正後の著作権法に基づいて考察した
|