2018 Fiscal Year Annual Research Report
Annotation of syntactic and semantic information for a corpus of Old Japanese
Project/Area Number |
18K00560
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
HORN S.W. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70801538)
|
Project Period (FY) |
2018-04-01 – 2019-03-31
|
Keywords | 上代語 / コーパス言語学 / 統語構造 / 文法役割 / ゼロ代名詞 / 直接構成素分析 / 形態情報 / 意味解析 |
Outline of Annual Research Achievements |
研究実績として、まずONCOJウェブサイト(http://oncoj.ninjal.ac.jp/)における単語リストの見出し語の増減や訳語の補填、ドキュメンテーションの追加、テキスト表示の改善などを行った。コーパス自体の改善した内容とともに、アップデートとして9月下旬に公開した。日本語学会2018年度秋季大会にて「『オックスフォード・NINJAL上代語コーパス』の公開」という題で紹介をした(岐阜大学、2018年10月14日)。 コーパスに基づいた上代語の基本研究として、不定詞の分布と解釈の調査を行い、その結果を「上代語の疑問詞と数量化について」という題で、国際シンポジウムで発表した(「通時コーパスに基づく日本語文法研究」,国立国語研究所、2018年9月8‐9日)。「いづれ、なに、たれ」などの語を対象に、注釈や全集の現代訳などをまとめて、統語関係と照らし合わせた。どんな場合に不定代名詞が存在数量詞や全称数量詞を形成するか、疑問詞としての解釈の十分条件は何であるかを考えた。語順や活用形の特徴、係り助詞や否定の有無、モダリティーなどの要素を記述し、文の分類とその中での不定詞の解釈に及ぼす影響を分析した。 統語情報付与に直接つながる活動として、コーパス自体の内容の改良・整合化がある。形態論情報と文法機能とが関連付けやすくなるように、語の内在構造をできるだけ平らにし、屈折語については、活用形に関する情報を語のレベルだけではなく、その語が主要部となっている節のレベルでも表すことにした。枕詞・地名などの構造の整合化と語彙表登録も行った。レッマ化の作業もある程度進めた。実質的な統語情報としては、1)「主題」の取り扱いを変えて、述語とローカルな関係に入れて、文法役割を可能な限り記述し、2)並列構文のアノテーションを導入した。この活動の一部分は2018年9月のアップデートの中に反映されている。
|
Research Products
(3 results)