研究課題/領域番号 |
17H01835
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
図書館情報学・人文社会情報学
|
研究機関 | 京都大学 |
研究代表者 |
安岡 孝一 京都大学, 人文科学研究所, 教授 (20230211)
|
研究分担者 |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 教授 (70351294)
Wittern C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
14,560千円 (直接経費: 11,200千円、間接経費: 3,360千円)
2019年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2018年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2017年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
|
キーワード | 文法解析 / 古典中国語 / 文学情報 |
研究成果の概要 |
古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを、自動抽出する手法の開発をおこなった。具体的には、Universal Dependenciesと呼ばれる文法記述手法を用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の係り受けコーパスを制作し、これを用いて、古典漢文の形態素解析と依存文法解析(係り受け解析)をおこなうツールUD-Kanbunを作成した。さらに、このツールを発展させて、動詞の作用域を元に返り点の自動生成をおこない、日本語の活用語尾と助詞を自動で付加することで、自動的に訓読をおこなうツールUD-Kundokuを試作した。
|
研究成果の学術的意義や社会的意義 |
古典漢文における単語間の係り受けを自動で抽出する手法を実現したことで、これまで文法的な構造化がおこなわれず白文(単なる漢字の列)のままで放置されてきた大量の古典漢文テキストに対し、その構造化すなわち文法解析をおこなうための端緒を付けることができた。また、高等学校などで教授されている漢文訓読という手法を、現代的なコンピュータ処理によって自動化することにより、漢文訓読が言語学的に(特に依存文法における解析として)何をおこなっているのかを、コンピュータプログラムの形で示すことに成功した。
|