2019 Fiscal Year Research-status Report
自動形態素解析を利用した15世紀朝鮮語解析済みコーパスの構築
Project/Area Number |
17K02758
|
Research Institution | Kindai University |
Principal Investigator |
須賀井 義教 近畿大学, 総合社会学部, 准教授 (60454641)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 朝鮮語史 / 形態素解析 / コーパス |
Outline of Annual Research Achievements |
計画の最終年度である令和元年度にも,前年度に引き続き(1)オープンソース形態素解析エンジンであるMeCab(めかぶ)を用いて形態素解析を行うための解析用辞書を構築し,実際に(2)15世紀朝鮮語の形態素解析を行った.(1)で用いる解析用辞書は,登録されている項目が8800項目,辞書の学習に用いている学習用データは2423文となった.解析とその結果の修正は,初年度の『釈譜詳節』巻六と巻十三,2年目の同・巻九,巻十九,巻二十三(本文のみ)に加えて,同・巻二十三(注釈),巻二十四,『阿弥陀経諺解』,『金剛経諺解』(解義を除く本文とその注釈),『三綱行実図諺解』の作業が終了した. また,オープンソースソフトウェアを公開するためのレポジトリ「OSDN」に「MkHanDic」として公開した(https://ja.osdn.net/pkg/handic/mkhandic-mecab). これらの形態素解析結果を活用し,『釈譜詳節』の各巻を計量的な方法で分類する試みを行い,中国・山東大学で行われた第一届多元文化研究与跨文化教育国際研討会(山東大学中心校区・知新楼第三会議室,2019年9月20日)にて発表を行った.さらに資料を追加し,分析の方法にも検討を加えた内容を朝鮮語研究会で発表する予定であったが,新型コロナウイルス感染症の感染拡大に伴って研究会が中止されたため,発表することができなかった.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
解析用辞書の構築や解析済みデータの蓄積などは,概ね順調に進んだものの,当初予定していた成果発表が学会の延期・中止などにより行えなかった.そのため,補助事業期間の延長を申請した.
|
Strategy for Future Research Activity |
補助事業期間の延長が承認されたため,延長された期間内に成果の発表を行う.また,『釈譜詳節』巻二十や巻二十一などその他の文献についても解析を行い,データの蓄積を進めていく予定である.
|
Causes of Carryover |
当初予定していた学会が延期となり,支出予定の旅費が使用されなかったため.次年度の成果発表のため,旅費として使用する予定.
|