研究課題/領域番号 |
25280122
|
研究種目 |
基盤研究(B)
|
研究機関 | 京都大学 |
研究代表者 |
安岡 孝一 京都大学, 人文科学研究所, 准教授 (20230211)
|
研究分担者 |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 准教授 (70351294)
WITTERN C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(研究院), 講師 (20513360)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 古典漢文 / コーパス / 品詞解析 |
研究概要 |
品詞情報を付加したコーパス化をおこなう古典漢文テキストとして、『漢文大系』から「十八史略」を選び出し、官職情報の抽出のための古典漢文コーパスを作成した。また、この漢文コーパスを用いた形態素解析の結果を、官職情報の抽出という側面から検討した。これらの古典漢文コーパスと、それらに関する検討状況は、逐一「東アジア古典文献コーパスの応用研究」ページ http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/ において、WWW経由での公開をおこなっている。これに加え、検討結果の一部を、CHISEの「古典中国語形態素用例」としてWWW公開すると同時に、研究全体の進行状況を、国際シンポジウム「2013 International Conference on Culture and Computing」および「東洋学へのコンピュータ利用」第25回研究セミナーにて発表した。また、2014年7月にローザンヌで開催予定の国際シンポジウム「Digital Humanities 2014」においても、これらの研究結果を発表予定である。 各形態素用例と、それらの出現する文脈とを検討した結果、官職情報の抽出には、地名情報との共起関係を考慮する必要があり、同時に、品詞分類を多少チューニングする必要性が生じてきている。これらの検討結果を勘案し、当初の予定どおり2014年度は、地名情報の抽出をおこなうと同時に、共起関係を処理するためのクラスタリング手法の開発に挑む。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
官職に関する共起確率は、動詞との関係はかならずしも高くなく、むしろ、地名との共起関係が高いことが明らかになった。これにより、官職のキーワード抽出のためのクラスタリング手法に、一定の目処が立った。
|
今後の研究の推進方策 |
2014年度は、予定通り、地名に特化した古典漢文コーパスの入力をおこない、同時にキーワード抽出のためのクラスタリング手法の開発をおこなう。
|