2020 Fiscal Year Research-status Report
計量的分析のための15世紀朝鮮語形態素解析済みコーパス構築:仏教諺解を対象に
Project/Area Number |
20K00558
|
Research Institution | Kindai University |
Principal Investigator |
須賀井 義教 近畿大学, 総合社会学部, 准教授 (60454641)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 朝鮮語史 / コーパス / 形態素解析 / 計量的分析 / TEI |
Outline of Annual Research Achievements |
計画の初年度である令和2年度には,既に構築し公開しているMeCab(めかぶ)向けの15世紀朝鮮語形態素解析用辞書「MkHanDic」に,辞書項目と学習用データを追加した.追加したデータは『釈譜詳節』巻20および21である.現在の辞書項目数は9185項目で,学習用データは2653文である. また,15世紀の朝鮮語資料である『月印釈譜』の形態素解析を進めるための準備作業として,電子データの整備を行った.電子データ化の際には国際的に活用されているTEI(Text Encoding Initiative)ガイドラインを用いた.TEIガイドラインの活用により,他の研究者にとっても可読性・可搬性が高まり,また他分野の研究成果などを援用することが可能となる.例として,日本語研究のためのXML検索ツール「ひまわり」を用いて,15世紀資料の検索を行うことができた.TEIガイドラインを用いて,『月印釈譜』巻1・2,『釈譜詳節』巻6・9・13・19・20・21・23・24,『三綱行実図』の電子データを構築,再整備した. 上記の方法で作成した電子データのうち,『月印釈譜』巻1について,散文部分に該当する釈譜詳節のセクションの形態素解析を行い,結果の修正作業を行った.今後は『月印釈譜』の他の巻についても継続して作業を行っていく予定である. また,今年度の作業および同時に遂行する科研費課題とを含めて,第266回・朝鮮語研究会(オンライン開催.2020年9月5日)にて成果発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
形態素解析については概ね順調に進展している. ただし,当初計画にあった研究協力者からの知識提供については,出張ができず今年度は実施を見送った.オンラインでの会議などを今後検討する予定である.
|
Strategy for Future Research Activity |
形態素解析を進めていくだけでなく,TEIを利用した電子データの構築とその活用方法,また分析する単位の策定など,基本的な作業についても進めていく.計量的な分析を行うには,分析をする際の言語単位が一定である必要がある.仏教用語など,どこまでを1語とみなすか,より厳格に策定していく予定である.
|
Causes of Carryover |
新型コロナウイルス感染症の感染拡大をうけて,多くの学会・研究会がオンラインで開催されたり,研究協力者へのヒアリングや文献調査のための出張が行われなかったため. 感染拡大が下火になれば,文献調査などのために出張を積極的に行う予定である.
|
Research Products
(3 results)