2014 Fiscal Year Annual Research Report
Project/Area Number |
25280122
|
Research Institution | Kyoto University |
Principal Investigator |
安岡 孝一 京都大学, 人文科学研究所, 准教授 (20230211)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 准教授 (70351294)
WITTERN C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(研究院), 講師 (20513360)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 古典漢文 / コーパス / 品詞解析 |
Outline of Annual Research Achievements |
品詞情報を付加したコーパス化をおこなう古典漢文テキストとして、『漢文大系』から「十八史略」を選び、地名情報抽出のための古典漢文コーパスと、来年度分を一部先取りして人名情報抽出のための古典漢文コーパスを作成した。さらに、この漢文コーパスを用いた形態素解析の結果を、地名情報の抽出という側面から検討した。これに合わせ、形態素解析に用いる古典漢文辞書に、地名を大量に追加するという手法を試し、非常に良好な結果を得た。 この手法の有効性をさらに検討すべく、従来われわれが使用してきた古典漢文辞書と、今回あらたに作った古典漢文辞書、さらには、これらの古典漢文辞書からあえて全ての地名を取り除いた辞書を作成し、それらに応じてF値がどのように変化するかを検証した。結論から言えば、あらたに作った古典漢文辞書が地名抽出に際してもっともF値が高く、また、それは、地名用例以外に対して何ら悪影響を及ぼさないことが検証できた。 研究状況に関しては、逐一「東アジア古典文献コーパスの応用研究」ページ http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/ において、WWW経由での公開をおこなっている。これに加え、検討結果の一部をCHISEの「古典中国語形態素用例」としてWWW公開すると同時に、研究全体の進行状況について国際シンポジウム「Digital Humanities 2014」および「じんもんこん2014」にて発表をおこなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
地名の抽出手法は、古典漢文辞書の見直しというかなり大胆な手法によって、思いのほか順調に開発が進んだ。これによって、来年度予定している人名の抽出手法についても、一定の目処が立っている。
|
Strategy for Future Research Activity |
2015年度は、予定通り、人名に特化したキーワード抽出のためのクラスタリング手法の開発をおこない、3年間の研究の総仕上げとする。
|
Research Products
(10 results)