• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Building a Morphologically Analyzed Corpus of 15th Century Korean for Quantitative Analysis

Research Project

Project/Area Number 20K00558
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 02060:Linguistics-related
Research InstitutionKindai University

Principal Investigator

Sugai Yoshinori  近畿大学, 総合社会学部, 准教授 (60454641)

Project Period (FY) 2020-04-01 – 2024-03-31
Project Status Completed (Fiscal Year 2023)
Budget Amount *help
¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Keywords朝鮮語史 / 形態素解析 / コーパス / 計量的分析 / TEIガイドライン / TEI / 言語学 / コーパス言語学 / 朝鮮語学
Outline of Research at the Start

本研究は15 世紀の朝鮮語文献,特に仏教諺解について形態素解析を行い,コーパスとして構築することを目的とする.形態素解析においては,形態素解析エンジン「MeCab」(めかぶ)を用いる.本研究では15 世紀朝鮮語文献のうち,仏教諺解の『月印釈譜』(1459年刊)および『法華経諺解』(1463 年刊)をコーパス化の対象とする.この過程で作成されるコーパスデータや解析用辞書については,広く今後の朝鮮語史研究に資するべく,インターネットを通じて公開する.本研究を通じて公開されるデータや検索ツールなどによって,朝鮮語情報処理の質的向上ならびに朝鮮語史研究の新たな展開に寄与することを目指す.

Outline of Final Research Achievements

For this research project, a dictionary for analyzing 15th century Korean was constructed using the open source morphological analysis engine "MeCab", and morphological analysis of "Wolin-seokbo" was conducted. The lexicon contains approximately 10,000 entries, and was released on the Internet as open source software. In addition, the 15th century Korean documents were digitized using the TEI guidelines.
Using the above analyzed data, a quantitative analysis of the 15th century Korean language was conducted.

Academic Significance and Societal Importance of the Research Achievements

本研究で構築したデータをオープンソースソフトウェアとして公開することにより,朝鮮語情報処理の質的向上に寄与することが期待される.解析用辞書構築の手法については,朝鮮語のみならず他の言語についても同様の試みを行うことが可能であり,様々な言語の自然言語処理技術に貢献することが見込まれる.
また,形態素解析済みデータを用いた朝鮮語史の記述を実践することで,計量的な手法による15世紀朝鮮語研究の実例を示すこととなり,併せて従来の知見の補充や刷新を行うことが可能となる.

Report

(5 results)
  • 2023 Annual Research Report   Final Research Report ( PDF )
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (5 results)

All 2022 2020 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (1 results) Remarks (3 results)

  • [Journal Article] 中期朝鮮語の計量的分析の試み2022

    • Author(s)
      須賀井 義教
    • Journal Title

      Journal of the Society for Korean Linguistics in Japan

      Volume: 9 Issue: 0 Pages: 175-207

    • DOI

      10.50986/koreanlinguistics.9.0_175

    • ISSN
      1347-2690, 2436-5661
    • Year and Date
      2022-02-22
    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Presentation] 中期朝鮮語の計量的分析の試み―クラスター分析による『釈譜詳節』各巻の分類―2020

    • Author(s)
      須賀井義教
    • Organizer
      朝鮮語研究会
    • Related Report
      2020 Research-status Report
  • [Remarks] MkHanDic

    • URL

      https://github.com/okikirmui/mkhandic

    • Related Report
      2023 Annual Research Report
  • [Remarks] MeCab用形態素解析辞書MkHanDic

    • URL

      https://ja.osdn.net/pkg/handic/mkhandic-mecab

    • Related Report
      2022 Research-status Report 2021 Research-status Report 2020 Research-status Report
  • [Remarks] MeCabで韓国語

    • URL

      https://porocise.sakura.ne.jp/wiki/korean/mecab

    • Related Report
      2022 Research-status Report 2021 Research-status Report 2020 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2025-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi