研究課題/領域番号 |
16K16839
|
研究機関 | 目白大学 |
研究代表者 |
氷野 善寛 目白大学, 外国語学部, 専任講師 (80512706)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 中国語 / 中国語教材 / 形態素解析 |
研究実績の概要 |
本研究は中国語教育・研究双方で利用できる「中国語形態素解析システム」と形態素解析に必要な「解析用辞書」を構築することを目的としている。この「中国語形態素解析システム」が目指す最終的な到達点としては、研究目的として過去100年程度における中国語教材に含まれる中国語のテキストを通時的に解析する能力を有し、さらに現代の中国語教材を対象として、教育目的での解析が可能となる能力を有するシステムを構築することにある。 今年度の研究の実施状況については、上記目標を達成するために、前年度に引き続き、構築した形態素解析システムのアップデート作業を行うと共に、アップデートをより容易に実施するための方法を模索した。具体的には中国語教材などのテキスト解析を行うために必要となる解析用辞書のアップデート作業を中国語教材を中心とした学習用コーパスを作成することや、複数の辞書を並行して作るなどして、断続的に実施し、解析精度の向上に努めた。同時に各時代における資料の整理を行うと共に、各時代における中国語教材など原資料の収集を積極的に行った。 また解析システムをウェブで最終年度に正式に公開するための下準備として、また解析辞書のアップデートをより容易に実施するためのプログラム開発を行うために必要となる技術的要件の整理を行った。また必要となるサーバーのスペックの調査を行うために、仮利用しているVPSサーバーを中心にベンチマークテストを行うなどした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の中心課題である、形態素解析システムの構築、資料の収集はおおむね順調に進行している。形態素解析システムの構築も概ね順調で、辞書をアップデートするための学習コーパスの整備も進んでいる。
|
今後の研究の推進方策 |
前年度に引き続き、中国語の解析システムの開発、解析辞書のアップデートを行う。最終年度では特にこの解析システムにおける解析辞書のアップデート作業をより容易に行うためのシステム開発を行い、中国語解析システムの正式公開に向けて公開用のサーバーの整備を進めていく。並行して、前年度同様に過去150年の間に出版された教材の整理を行い、教材が利用されている範囲、印刷部数、社会的影響力など複数の観点から教科書を評価しデータ化する教材を選定し、解析辞書をアップデートするための学習コーパスの作成につとめる。
|
次年度使用額が生じた理由 |
システムを公開するためのサーバー諸費用と、解析辞書のアップデートをウェブ上で実施するためのプログラム開発に利用するため。
|