2014 Fiscal Year Annual Research Report
現代韓国語自動形態素解析のための辞書構築とその応用
Project/Area Number |
25770164
|
Research Institution | Kinki University |
Principal Investigator |
須賀井 義教 近畿大学, 総合社会学部, 准教授 (60454641)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 韓国語 / 韓国語教育 / 形態素解析 / e-learning |
Outline of Annual Research Achievements |
計画の最終年度である本年も,主としてMeCab用形態素解析辞書の項目補充を行い,また品詞体系の見直しを行った.前年度終了時点での登録項目数は76,395項目であったが,本年は105,905項目まで,約3万項目を追加した.主に地名や動詞,形容詞,語根の項目補充を行った.地名についてはアルバイト学生の作業により項目をピックアップし,追加した. また,同時に学習用コーパスの補充も行った.本年の作業では2,200文からなるコーパスを作成した.これまでは評論文などを中心にコーパスを作成してきたが,本年は新聞記事を2割程度含めた.名詞で文章が終わるなど,新聞の文体が通常の文体とは異なるためである.このコーパスを用いて,上記の項目数から成る形態素解析用辞書を構築した. 本年の成果発表として,韓国辞書学会第26回学術大会にて口頭発表を行った. なお,本研究の成果である形態素解析用辞書をオープンソースで公開するため,プロジェクト用ウェブサイトを作成した.
|