研究課題
本研究では,文の構造と意味との関係を明示的に理論の中に取り組んだ組合せ範疇文法(CCG: Combinatory Categorial Grammar)の枠組みに基づいて,これまで手動で記述されてきた意味情報を,形態・構文情報が付与されたテキストコーパスから(半)自動的に抽出することを目的として調査研究を推進してきた.今年度は,言語情報の抽出を指向して作成してきた実験的な小規模コーパスを,今後より大規模なものへと発展させるための準備として,複数作業者のアノテーションを統制する方法について検討した.研究のひとまずの区切りとして,最終年度内に成果を発表して評価を得るべく,問題を構文情報,とりわけ外国語を学ぶ日本人が陥りやすい「一致の誤り」という現象に絞り込み,コーパスからそのような文法誤りを(半)自動的に抽出するためのアノテーションスキームを提案した.研究期間全体を通じてCCGに基づく日本語の構文・意味情報の形式化を検討し,リンキングといった意味情報の解析における重要かつ難解な問題への言語理論的アプローチに取組んだ.また,そうした理論研究と並行して小規模コーパスを構築し,そして,そのような取組みを大規模なものへと発展させるアノテーションスキームの開発も行った.コーパスの規模の拡大だけでなく,言語現象の広範な分析においては,予想以上に個人で計画を推進することに力不足を感じ,反省せざるを得なかったが,毎年国際会議で成果を発表してきた点では研究の進捗を示していると評価したい.
すべて 2014
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (1件)
Proceedings of the 28th Pacific Asia Conference on Language, Information, and Computation
巻: 28 ページ: 234-243