• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

中国語における形態素解析システムの構築と中国語基本語彙研究に関する試み

研究課題

研究課題/領域番号 16K16839
研究機関目白大学

研究代表者

氷野 善寛  目白大学, 外国語学部, 専任講師 (80512706)

研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード中国語 / 中国語教材 / 形態素解析
研究実績の概要

本研究は中国語教育・研究双方で利用できる「中国語形態素解析システム」と形態素解析に必要な「解析用辞書」を構築することを目的としている。この「中国語形態素解析システム」が目指す最終的な到達点としては、研究目的として過去100年程度における中国語教材に含まれる中国語のテキストを通時的に解析する能力を有し、さらに現代の中国語教材を対象として、教育目的での解析が可能となる能力を有するシステムを構築することにある。
今年度も昨年度に引き続き解析用辞書のアップデート作業を中国語教材を中心とした学習用コーパスを作成することや、複数の辞書を並行して作るなどして、断続的に実施し、解析精度の向上に努めた。中国語教材に関する新資料の収集作業に加え、テキストデータ化を進めている。
システム面では、開発を進める中国語形態素解析システムを用いた基本語彙の解析用データベースの設置を行い、運用中のVPSサーバーに、「中国語基本語彙検証データベース」と題したデータベースの設置を実施した。同データベースでは、試験的に収録した中国語データの全文検索及び、特定ワードの出現頻度をグラフ化して表示できるようにしている。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

当初3年計画で実施している研究であったが、資料の収集、資料のデジタル化、形態素解析、データベースの構築と運用に至るまで、研究内容が多岐にわたっているため、より精度の高い研究を実施するため延長申請を行った。

今後の研究の推進方策

前年度に引き続き、解析システムのアップデートを行うことに注力する。データの補完につとめ公開の準備を進めるとともに、今年度は研究内容を積極的に発表する機会を設ける。
また並行して、前年度同様に過去150年の間に出版された教材の整理を行い、教材が利用されている範囲、印刷部数、社会的影響力など複数の観点から教科書を評価しデータ化する教材を選定し、解析辞書をアップデートするための学習コーパスの作成につとめる。

次年度使用額が生じた理由

学会での発表を2019年度に変更したため差額が生じた。

  • 研究成果

    (5件)

すべて 2018 その他

すべて 雑誌論文 (1件) 学会発表 (3件) (うち国際学会 1件) 備考 (1件)

  • [雑誌論文] 形態素解析の中国語教育への応用2018

    • 著者名/発表者名
      氷野善寛
    • 雑誌名

      漢字文献情報処理研究

      巻: 第18号 ページ: pp.51-55

  • [学会発表] 中国語教育における中国語の分割システム2018

    • 著者名/発表者名
      氷野善寛
    • 学会等名
      FLExICT Expo 2018
  • [学会発表] 中国語の形態素解析2018

    • 著者名/発表者名
      氷野善寛
    • 学会等名
      東西学術研究所・関西大学アジア・オープン・リサーチセンター合同ワークショップ「日中自然言語の処理に関して」
  • [学会発表] 日本漢語教材的歴史演変2018

    • 著者名/発表者名
      氷野善寛
    • 学会等名
      世界漢語教育史研究学会第十届年会「デジタル化時代におけるグローバル中国語教育史国際シンポジウム
    • 国際学会
  • [備考]

    • URL

      https://www.ch-analysis.org/

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi