2020 Fiscal Year Final Research Report
Development of tagged Middle Korean corpus using morphological analyzer
Project/Area Number |
17K02758
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Linguistics
|
Research Institution | Kindai University |
Principal Investigator |
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 朝鮮語史 / 形態素解析 / コーパス / 計量的分析 |
Outline of Final Research Achievements |
For this research project, we used the open source morphological analysis engine, MeCab, to build a dictionary for analyzing the middle Korean language. For this research, we built a morphological analysis-use dictionary from approximately 9,000 registered items and analyzed representative documents such as "Seokbosangjeol", "Amitagyeong Eonhae", etc. The dictionary that we built is available to the public on the internet as open source software.
|
Free Research Field |
言語学
|
Academic Significance and Societal Importance of the Research Achievements |
本研究で構築した形態素解析用辞書をオープンソースで公開することにより,朝鮮語情報処理の質的向上に寄与することができると考える.解析用辞書の公開は,朝鮮語のみならず他の言語についても同様の試みを行うことが可能であることを示しており,様々な言語の自然言語処理技術に貢献することが見込まれる. また形態素解析済みデータを用いた朝鮮語史の記述を試みることで,計量的な手法による朝鮮語史研究に新たな展開をもたらし,従来の知見の補充や刷新を行うことが可能となることが期待できる.
|