研究課題
基盤研究(C)
本研究では,オープンソース形態素解析エンジン「MeCab(めかぶ)」を利用して15世紀朝鮮語を解析するための辞書を構築し,代表的な文献である『釈譜詳節』に加え,仏教経典の翻訳である『阿弥陀経諺解』『金剛経諺解』,教化書である『三綱行実図諺解』の形態素解析を行った.構築した解析用辞書は,オープンソースソフトウェアとしてインターネットで公開している.また,上記の解析済みデータを利用して,15世紀朝鮮語の計量的な分析を行った.
言語学
本研究で構築した形態素解析用辞書をオープンソースで公開することにより,朝鮮語情報処理の質的向上に寄与することができると考える.解析用辞書の公開は,朝鮮語のみならず他の言語についても同様の試みを行うことが可能であることを示しており,様々な言語の自然言語処理技術に貢献することが見込まれる.また形態素解析済みデータを用いた朝鮮語史の記述を試みることで,計量的な手法による朝鮮語史研究に新たな展開をもたらし,従来の知見の補充や刷新を行うことが可能となることが期待できる.