Project/Area Number |
17H00009
|
Research Category |
Grant-in-Aid for Encouragement of Scientists
|
Allocation Type | Single-year Grants |
Research Field |
国語・国文学
|
Research Institution | 文部科学省 |
Principal Investigator |
今田 水穂 文部科学省, 初等中等教育局, 教科書調査官
|
Project Period (FY) |
2017
|
Project Status |
Completed (Fiscal Year 2017)
|
Budget Amount *help |
¥520,000 (Direct Cost: ¥520,000)
Fiscal Year 2017: ¥520,000 (Direct Cost: ¥520,000)
|
Keywords | 名詞述語文 / コーパス言語学 / 意味論 |
Outline of Annual Research Achievements |
「現代日本語書き言葉均衡コーパス」(BCCWJ)コアデータの書籍・雑誌・新聞・白書の4サブコーパスの全体に対して名詞述語文のアノテーションを実施し、名詞述語文の構造と意味に関するラベル(主語、述語、補語、連体修飾節)約3万、名詞述語に由来する機能表現など周辺的ラベル約5千からなるアノテーションデータを作成した。この結果、名詞主語とノ節主語の割合は前者が9割を超えること、名詞主語のうち主語と述語の意味論的タイプが一致するもの(is-aまたはis-the)は約5割程度に過ぎないこと、ノ節主語のうち分裂文は6割弱であること、名詞述語の約2割が連体修飾節を持ち、その4割弱が外の関係の連体修飾節であること、周辺的表現のいくつかの類型は2つの文節が融合して単一文節化したものとして一般化できることなどを確認した。このデータは記述的には措定文、指定文、ウナギ文、隠喩文、文末名詞文、分裂文、定義文など名詞述語文の下位分類の絞り込みに有用であり、また理論的には名詞述語文の構造と解釈のマッピングや、名詞の結合価と分類の研究に役立つことが期待できる。一方で予算の都合から属格名詞句に対するアノテーションなど一部の計画を縮小したため結合価の分析に必要な情報の一部が不足しており、今後もデータの拡充を継続していく必要がある。本年度内に構築したデータはBCCWJ本文テキストとマージしたXMLコーパスとして整形し、国立国語研究所のBCCWJアノテーションデータ配布サイトに委託し公開した。
|