2015 Fiscal Year Annual Research Report
Project/Area Number |
25280122
|
Research Institution | Kyoto University |
Principal Investigator |
安岡 孝一 京都大学, 人文科学研究所, 教授 (20230211)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘 関西大学, 文学部, 教授 (70292258)
師 茂樹 花園大学, 文学部, 教授 (70351294)
Wittern C. 京都大学, 人文科学研究所, 教授 (20333560)
池田 巧 京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦 京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾 大阪大学, 言語文化研究科(研究院), 講師 (20513360)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 古典漢文 / コーパス |
Outline of Annual Research Achievements |
品詞情報を付加したコーパス化をおこなう古典漢文テキストとして、『漢文大系』から「十八史略」および「孟子」を選び、人名情報抽出のための古典漢文コーパスを作成した。さらに、この漢文コーパスを用いた形態素解析の結果を、地名情報の抽出という側面から検討した。 この結果、姓氏の自動抽出については、地名と同様の手法で可能であるとの感触を得た。すなわち、形態素解析に用いる古典漢文辞書に、姓氏を大量に追加する手法によって、姓氏はほぼ全てを自動抽出できる。 その一方で、名や諱については、自動抽出がかなり困難な例が多数みつかった。典型例が『十八史略』巻之二に登場する「李斯」である。巻之二には「斯」が16例出現するのだが、うち6例までは「李斯」という形で出現することから、これらについては「斯」が名を意味していることは容易に判定できる。一方、残る10例は「斯」が単独で現れるが、最初の9例が名で、最後の1例だけが代名詞、という非常に自動判定の難しい形になっていた。これを自動抽出するような手法は、残念ながら、研究期間中には開発することができなかった。 なお、研究状況に関しては、http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/archive2016.html でWWW公開している。また、これまでの検討結果を合わせて、『東洋学へのコンピュータ利用』第27回研究セミナーで発表をおこなった。
|
Research Progress Status |
27年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
27年度が最終年度であるため、記入しない。
|
Causes of Carryover |
27年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
27年度が最終年度であるため、記入しない。
|
Research Products
(4 results)