2023 Fiscal Year Final Research Report
Dependency-Parsing in Classical Chinese under Universal Dependencies
Project/Area Number |
20H04481
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Kyoto University |
Principal Investigator |
YASUOKA Koichi 京都大学, 人文科学研究所, 教授 (20230211)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 教授 (70351294)
Wittern C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
白須 裕之 京都大学, 人文科学研究所, 助教 (30828570)
鈴木 慎吾 大阪大学, 大学院人文学研究科(外国学専攻、日本学専攻), 准教授 (20513360)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 言語処理 / 古典漢文 |
Outline of Final Research Achievements |
We have developed RoBERTa-Classical-Chinese and its fine-tuned models for Classical Chinese to perform sentence segmentation, word tokenization, part-of-speech tagging, dependency-parsing between words, phrase detection, and dependency-parsing between phrases. And we have applied our methods to other isolating languages, such as Vietnamese and Thai.
|
Free Research Field |
人文情報学
|
Academic Significance and Societal Importance of the Research Achievements |
学術的意義としては、古典漢文の白文(単なる漢字の列)が、本研究の手法により、文・節・単語の単位に区切ることが出来るようになる上に、それらの関係(どの単語が動詞で、その主語や目的語はどれなのか、など)が、非常に高い精度で自動解析できるようになった。 一方、社会的意義としては、本研究の手法が、ベトナム語やタイ語にも適用可能であるという点が挙げられる。ベトナム語もタイ語も、単語の切れ目すら見極めるのが難しい言語であり、それが自動解析できるようになる意義は大きい。
|