2019 Fiscal Year Annual Research Report
古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出
Project/Area Number |
17H01835
|
Research Institution | Kyoto University |
Principal Investigator |
安岡 孝一 京都大学, 人文科学研究所, 教授 (20230211)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 教授 (70351294)
Wittern C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 文法解析 / 古典中国語 |
Outline of Annual Research Achievements |
古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを自動抽出すべく、文法記述手法と自動抽出手法の検討をおこなった。具体的には、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesを用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の全文コーパスを作成した。これらの全文コーパスを、京都大学人文科学研究所附属東アジア人文情報学研究センターのGitLabからWWW公開すると同時に、プラハ・カレル大学との国際連携により、Universal Dependencies 2.4およびUniversal Dependencies 2.5の一部として、WWW公開した。 また、形態素解析エンジンMeCabと依存文法解析エンジンUDPipeを組み合わせて、古典漢文における動詞の作用域抽出のみならず、動詞・名詞間の係り受け解析をおこなうツールを作成し、UD-KanbunというpythonモジュールとしてWWW公開した。このUD-Kanbunのさらなる応用として、動詞の作用域にもとづいて漢文の返り点を自動抽出し、抽出した動詞に日本語の活用語尾を自動で付加し、さらには抽出した名詞に日本語の助詞を自動で付加することで、漢文の自動訓読をおこなうツールを試作し、UD-KundokuというpythonモジュールとしてWWW公開した。さらにデモンストレーションとして、令和2年1月の大学入試センター試験「国語」の第4問(本文)から返り点と送り仮名を除去し、あらためてUD-Kundokuで処理したところ、かなり高い精度で自動訓読できることが実証された。
|
Research Progress Status |
令和元年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和元年度が最終年度であるため、記入しない。
|
Research Products
(16 results)