研究課題/領域番号 |
16K16839
|
研究機関 | 目白大学 |
研究代表者 |
氷野 善寛 目白大学, 外国語学部, 専任講師 (80512706)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 中国語 / 中国語教材 / 形態素解析 |
研究実績の概要 |
本研究は中国語教育・研究双方で利用できる「中国語形態素解析システム」と形態素解析に必要な「解析用辞書」を構築することを目的としている。この「中国語形態素解析システム」が目指す最終的な到達点としては、研究目的として過去100年程度における中国語教材に含まれる中国語のテキストを通時的に解析する能力を有し、さらに現代の中国語教材を対象として、教育目的での解析が可能となる能力を有するシステムを構築することにある。 今年度も昨年度に引き続き解析用辞書のアップデート作業を中国語教材を中心とした学習用コーパスを作成することや、複数の辞書を並行して作るなどして、断続的に実施し、解析精度の向上に努めた。中国語教材に関する新資料の収集作業に加え、テキストデータ化を進めている。 システム面では、開発を進める中国語形態素解析システムを用いた基本語彙の解析用データベースの設置を行い、運用中のVPSサーバーに、「中国語基本語彙検証データベース」と題したデータベースの設置を実施した。同データベースでは、試験的に収録した中国語データの全文検索及び、特定ワードの出現頻度をグラフ化して表示できるようにしている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初3年計画で実施している研究であったが、資料の収集、資料のデジタル化、形態素解析、データベースの構築と運用に至るまで、研究内容が多岐にわたっているため、より精度の高い研究を実施するため延長申請を行った。
|
今後の研究の推進方策 |
前年度に引き続き、解析システムのアップデートを行うことに注力する。データの補完につとめ公開の準備を進めるとともに、今年度は研究内容を積極的に発表する機会を設ける。 また並行して、前年度同様に過去150年の間に出版された教材の整理を行い、教材が利用されている範囲、印刷部数、社会的影響力など複数の観点から教科書を評価しデータ化する教材を選定し、解析辞書をアップデートするための学習コーパスの作成につとめる。
|
次年度使用額が生じた理由 |
学会での発表を2019年度に変更したため差額が生じた。
|