2013 Fiscal Year Research-status Report
現代韓国語自動形態素解析のための辞書構築とその応用
Project/Area Number |
25770164
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Kinki University |
Principal Investigator |
須賀井 義教 近畿大学, 総合社会学部, 准教授 (60454641)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 韓国語 / 韓国語教育 / 形態素解析 / e-learning |
Research Abstract |
計画の初年度である本年は,主としてMeCab用形態素解析辞書の項目補充を行った.また,韓国語学習者向けの読解補助ツールを作成,公開した.以下,具体的に述べる. まず,計画の開始前に構築された辞書の項目は約61,000項目である.この辞書をベースに,本年は固有名詞などを中心に項目の追加を行った.研究代表者および入力補助のアルバイト学生で作業を分担し,インターネット上で公開されている資料やウィキペディアの項目などを中心に,大韓民国の行政区域名,鉄道駅名,高速道路,大学,官公庁,朝鮮半島の観光名所,外国の地名・人名などの項目を追加した.項目数は現在76,395項目であり,従来の解析用辞書と比べ15,000ほどの項目を追加することが出来た. また,構築した解析用辞書の応用として,韓国語読解補助ツールの開発を進めた.既に開発したツールを改訂・補充する形で作成し,研究代表者の管理するウェブサイト上で公開している.このツールは,韓国語学習者が自由に文章を入力,あるいはウェブページなどからコピー・アンド・ペーストする形で利用することができる.ツールの機能は大きく2つに分けられる.1つ目は,入力された韓国語の文章を解析し,その基本形や語彙の学習レベルなどを表示する機能である.2つ目は,ハングルで書かれた韓国語の文章のうち,「学生」や「教室」など,漢字表記の可能な項目について,全て漢字表記に変換を行う機能である.特に2つ目の機能は,これまでの学習補助ツールなどで見られなかった機能であり,またこれまで開発されてきた形態素解析ツールで実現できなかったものである.このツールについて,本年9月に発行された学術誌『韓国語教育』(韓国:国際韓国語教育学会)に論文を投稿,掲載された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
辞書項目の追加について,本年は目標を2万項目としたが,結果は約1万5千項目で,目標の達成にやや及ばなかった.しかし,未達成の場合でも辞書を構築し,使用することが可能であり,計画全体の遂行に特段の支障はないと思われる.
|
Strategy for Future Research Activity |
辞書項目の拡充を行う.特に,新聞記事などの解析に利用することができるよう,略語や会社名,組織名などを中心に項目の補充を行う予定である. また,現在構築している解析用辞書は,語彙の学習レベルを考慮しているため,項目の解析にムラがある.例えば「勉強する」という項目は学習用語彙として扱われており,全体で1項目として解析されるが,「応用する」の場合はそうではなく,「応用」と「する」とに解析される,と言った具合である.こうした解析は計量研究において問題が生じると見られるため,語彙の学習レベルを含めず,解析の単位を均一にした解析用辞書の開発を検討している. なお,開発した辞書は,オープンソース・ソフトウェアとして公開を予定している.
|
Expenditure Plans for the Next FY Research Funding |
研究室で現有のノートパソコンが数台あり,アルバイトが使用するデータ入力用パソコンを1台しか購入しなかったため,物品費の支出が計画通りとならなかった.また,アルバイトの雇用期間についても計画通りとならず,支出がやや不足した. 人件費・謝金については計画通り支出を行い,物品費の繰越分と合わせて入力用ノートパソコンを購入する.
|
Research Products
(2 results)