2017 Fiscal Year Annual Research Report
古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出
Project/Area Number |
17H01835
|
Research Institution | Kyoto University |
Principal Investigator |
安岡 孝一 京都大学, 人文科学研究所, 教授 (20230211)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 教授 (70351294)
Wittern C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 文法解析 / 古典中国語 |
Outline of Annual Research Achievements |
古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを、自動抽出すべく、まずは単文(動詞の作用域の中に他の動詞を含まない文)に対して、文法記述手法の検討をおこなった。当初は、Chomsky流の生成文法およびその変形による手法を試みたが、これらは動詞の作用域を抽出するという目的には、やや不適切であることが明らかとなった。そこで、様々な文法記述手法を検討し、最終的に、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesに辿りついた。 このUniversal Dependenciesを用いて、Pulleyblank『Outline of Classical Chinese Grammar』の597の例文を検討してみたところ、どの例文もほぼ問題なく記述できる上に、記述それ自体が動詞の作用域を示す形となった。そこで、これら597例文のUniversal Dependencies記述を、そのまま古典漢文Treebankの形に仕上げ、WWWで公開すると同時に、センター研究年報2018『Universal Dependenciesにもとづく古典中国語(漢文)の依存文法解析』として出版・公表した。さらに、Universal Dependenciesによる記述をおこなうための各種ツールを、SVG (Scalable Vector Graphics)とJavaScriptによって実装し、公表した。 また、本研究の基礎技術である古典漢文形態素コーパスに関し、情報処理学会論文誌に『古典中国語(漢文)の形態素解析とその応用』を発表したところ、当該論文が情報処理学会誌特選論文に選定された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
Chomsky流の生成文法から、Мельчук流の依存文法への移行をおこなったため、2017年度中にTreebankの作成に着手できず、延長申請をおこなった。現在は、当初予定に追いついている。
|
Strategy for Future Research Activity |
Universal Dependenciesによる古典漢文Treebankを拡充した上で、複文(動詞の作用域の中に他の動詞を含む文)の自動解析に挑戦する。
|
Research Products
(4 results)