研究課題/領域番号 |
20K00558
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 近畿大学 |
研究代表者 |
須賀井 義教 近畿大学, 総合社会学部, 准教授 (60454641)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 朝鮮語史 / 形態素解析 / コーパス / 計量的分析 / TEIガイドライン / TEI / 言語学 / コーパス言語学 / 朝鮮語学 |
研究開始時の研究の概要 |
本研究は15 世紀の朝鮮語文献,特に仏教諺解について形態素解析を行い,コーパスとして構築することを目的とする.形態素解析においては,形態素解析エンジン「MeCab」(めかぶ)を用いる.本研究では15 世紀朝鮮語文献のうち,仏教諺解の『月印釈譜』(1459年刊)および『法華経諺解』(1463 年刊)をコーパス化の対象とする.この過程で作成されるコーパスデータや解析用辞書については,広く今後の朝鮮語史研究に資するべく,インターネットを通じて公開する.本研究を通じて公開されるデータや検索ツールなどによって,朝鮮語情報処理の質的向上ならびに朝鮮語史研究の新たな展開に寄与することを目指す.
|
研究成果の概要 |
本研究では,オープンソース形態素解析エンジン「MeCab(めかぶ)」を利用して15世紀朝鮮語を解析するための辞書を構築し,代表的な文献である『月印釈譜」の形態素解析を行った.構築した解析用辞書は約1万項目が収録されており,この辞書データはオープンソースソフトウェアとしてインターネットで公開した.さらに,15世紀朝鮮語文献の電子データ化をTEIガイドラインを用いて行った. また,上記の解析済みデータを利用して,15世紀朝鮮語の計量的な分析を行った.
|
研究成果の学術的意義や社会的意義 |
本研究で構築したデータをオープンソースソフトウェアとして公開することにより,朝鮮語情報処理の質的向上に寄与することが期待される.解析用辞書構築の手法については,朝鮮語のみならず他の言語についても同様の試みを行うことが可能であり,様々な言語の自然言語処理技術に貢献することが見込まれる. また,形態素解析済みデータを用いた朝鮮語史の記述を実践することで,計量的な手法による15世紀朝鮮語研究の実例を示すこととなり,併せて従来の知見の補充や刷新を行うことが可能となる.
|