研究実績の概要 |
計画の最終年度である本年も,主としてMeCab用形態素解析辞書の項目補充を行い,また品詞体系の見直しを行った.前年度終了時点での登録項目数は76,395項目であったが,本年は105,905項目まで,約3万項目を追加した.主に地名や動詞,形容詞,語根の項目補充を行った.地名についてはアルバイト学生の作業により項目をピックアップし,追加した. また,同時に学習用コーパスの補充も行った.本年の作業では2,200文からなるコーパスを作成した.これまでは評論文などを中心にコーパスを作成してきたが,本年は新聞記事を2割程度含めた.名詞で文章が終わるなど,新聞の文体が通常の文体とは異なるためである.このコーパスを用いて,上記の項目数から成る形態素解析用辞書を構築した. 本年の成果発表として,韓国辞書学会第26回学術大会にて口頭発表を行った. なお,本研究の成果である形態素解析用辞書をオープンソースで公開するため,プロジェクト用ウェブサイトを作成した.
|