2018 Fiscal Year Annual Research Report
古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出
Project/Area Number |
17H01835
|
Research Institution | Kyoto University |
Principal Investigator |
安岡 孝一 京都大学, 人文科学研究所, 教授 (20230211)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 教授 (70351294)
Wittern C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 文法解析 / 古典中国語 |
Outline of Annual Research Achievements |
古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを、自動抽出すべく、複文(動詞の作用域の中に他の動詞を含む文)に対して、文法記述手法と自動抽出手法の検討をおこなった。具体的には、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesを用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の全文記述をおこなった。これらの全文記述を、そのまま古典漢文Treebankの形に仕上げ、WWWで公開すると同時に、『孟子』についてはセンター研究年報2018別冊「古典中国語Universal Dependenciesで読む『孟子』」として出版・公表した。 このTreebankをもとに、形態素解析エンジンMeCabと依存文法解析エンジンUDPipeを組み合わせて、古典漢文における動詞の作用域を自動抽出するツールを試作した。このツールを公開するにあたり、本手法の応用の一つとして、漢文の白文に自動で返り点を打つページをWWWで公開した。さらに、デモンストレーションとして、ここ5年間の大学入試センター試験「国語」の第4問(漢文)の本文から返り点を除去し、あらためて本研究の手法で返り点を打ってみせたところ、かなりの確度で返り点を打てることが実証された。 また、平成30年1月に情報処理学会「人文科学とコンピュータ」研究会で発表した『古典中国語Universal Dependenciesへの挑戦』に対し、本年度の情報処理学会第81回全国大会において、山下研究記念賞を受賞し表彰を受けた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
単文における「動詞の作用域」に続いて、複文における「動詞の作用域」もほぼ抽出可能となっており、順調に進展していると言える。
|
Strategy for Future Research Activity |
本手法の「動詞の作用域」の抽出精度をさらに上げると同時に、コピュラ文(動詞を含まない)の補語に、動詞を含んだ文が用いられているようなケースにおいて、本手法が拡張可能かどうか挑戦する。
|
Research Products
(10 results)