研究実績として、まずONCOJウェブサイト(http://oncoj.ninjal.ac.jp/)における単語リストの見出し語の増減や訳語の補填、ドキュメンテーションの追加、テキスト表示の改善などを行った。コーパス自体の改善した内容とともに、アップデートとして9月下旬に公開した。日本語学会2018年度秋季大会にて「『オックスフォード・NINJAL上代語コーパス』の公開」という題で紹介をした(岐阜大学、2018年10月14日)。 コーパスに基づいた上代語の基本研究として、不定詞の分布と解釈の調査を行い、その結果を「上代語の疑問詞と数量化について」という題で、国際シンポジウムで発表した(「通時コーパスに基づく日本語文法研究」,国立国語研究所、2018年9月8‐9日)。「いづれ、なに、たれ」などの語を対象に、注釈や全集の現代訳などをまとめて、統語関係と照らし合わせた。どんな場合に不定代名詞が存在数量詞や全称数量詞を形成するか、疑問詞としての解釈の十分条件は何であるかを考えた。語順や活用形の特徴、係り助詞や否定の有無、モダリティーなどの要素を記述し、文の分類とその中での不定詞の解釈に及ぼす影響を分析した。 統語情報付与に直接つながる活動として、コーパス自体の内容の改良・整合化がある。形態論情報と文法機能とが関連付けやすくなるように、語の内在構造をできるだけ平らにし、屈折語については、活用形に関する情報を語のレベルだけではなく、その語が主要部となっている節のレベルでも表すことにした。枕詞・地名などの構造の整合化と語彙表登録も行った。レッマ化の作業もある程度進めた。実質的な統語情報としては、1)「主題」の取り扱いを変えて、述語とローカルな関係に入れて、文法役割を可能な限り記述し、2)並列構文のアノテーションを導入した。この活動の一部分は2018年9月のアップデートの中に反映されている。
|