• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Final Research Report

Dependency-Parsing in Classical Chinese under Universal Dependencies

Research Project

  • PDF
Project/Area Number 20H04481
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionKyoto University

Principal Investigator

YASUOKA Koichi  京都大学, 人文科学研究所, 教授 (20230211)

Co-Investigator(Kenkyū-buntansha) 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
白須 裕之  京都大学, 人文科学研究所, 助教 (30828570)
鈴木 慎吾  大阪大学, 大学院人文学研究科(外国学専攻、日本学専攻), 准教授 (20513360)
Project Period (FY) 2020-04-01 – 2023-03-31
Keywords言語処理 / 古典漢文
Outline of Final Research Achievements

We have developed RoBERTa-Classical-Chinese and its fine-tuned models for Classical Chinese to perform sentence segmentation, word tokenization, part-of-speech tagging, dependency-parsing between words, phrase detection, and dependency-parsing between phrases. And we have applied our methods to other isolating languages, such as Vietnamese and Thai.

Free Research Field

人文情報学

Academic Significance and Societal Importance of the Research Achievements

学術的意義としては、古典漢文の白文(単なる漢字の列)が、本研究の手法により、文・節・単語の単位に区切ることが出来るようになる上に、それらの関係(どの単語が動詞で、その主語や目的語はどれなのか、など)が、非常に高い精度で自動解析できるようになった。
一方、社会的意義としては、本研究の手法が、ベトナム語やタイ語にも適用可能であるという点が挙げられる。ベトナム語もタイ語も、単語の切れ目すら見極めるのが難しい言語であり、それが自動解析できるようになる意義は大きい。

URL: 

Published: 2025-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi