研究課題
挑戦的萌芽研究
本研究では、近代語コーパスに対する統語情報アノテーションの仕様策定を行った。具体的には、文節係り受け・並列構造・述語項構造アノテーションを明六雑誌6サンプルに対して行い、問題点を明らかにした。このデータに基づき Universal Dependency に適応させたデータを開発した。同内容は2017年9月に開かれる国際会議 JADH-2017 で発表予定である。また、意味情報を含む他のレベルのアノテーションとして、節境界情報・分類語彙表番号アノテーションを試行的に行った。
コーパス言語学