• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Dependency Parsing in Classical Chinese along Morphological Corpora

Research Project

Project/Area Number 17H01835
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Research Field Library and information science/Humanistic social informatics
Research InstitutionKyoto University

Principal Investigator

Yasuoka Koichi  京都大学, 人文科学研究所, 教授 (20230211)

Co-Investigator(Kenkyū-buntansha) 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
Project Period (FY) 2017-04-01 – 2020-03-31
Project Status Completed (Fiscal Year 2019)
Budget Amount *help
¥14,560,000 (Direct Cost: ¥11,200,000、Indirect Cost: ¥3,360,000)
Fiscal Year 2019: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2018: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2017: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Keywords文法解析 / 古典中国語 / 文学情報
Outline of Final Research Achievements

We have developed a parsing method of dependencies between words in Classical Chinese. Our method is under the syntax scheme of Universal Dependencies, that are developed by natural language researchers all over the world. In a practical point of view, we have developed Universal Dependencies Treebank of the Four Books (孟子, 論語, 大學, and 中庸) in Classical Chinese, then developed a python-module named UD-Kanbun, which is tokenizer, POS-tagger, and dependency-parser for Classical Chinese. We also developed a python-module named UD-Kundoku, which is a transcriptive converter from Classical Chinese into Modern Japanese, along with an encode-reorder-decode scheme.

Academic Significance and Societal Importance of the Research Achievements

古典漢文における単語間の係り受けを自動で抽出する手法を実現したことで、これまで文法的な構造化がおこなわれず白文(単なる漢字の列)のままで放置されてきた大量の古典漢文テキストに対し、その構造化すなわち文法解析をおこなうための端緒を付けることができた。また、高等学校などで教授されている漢文訓読という手法を、現代的なコンピュータ処理によって自動化することにより、漢文訓読が言語学的に(特に依存文法における解析として)何をおこなっているのかを、コンピュータプログラムの形で示すことに成功した。

Report

(4 results)
  • 2019 Annual Research Report   Final Research Report ( PDF )
  • 2018 Annual Research Report
  • 2017 Annual Research Report
  • Research Products

    (30 results)

All 2020 2019 2018 Other

All Int'l Joint Research (1 results) Journal Article (16 results) (of which Open Access: 15 results,  Peer Reviewed: 6 results) Presentation (11 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results) Remarks (2 results)

  • [Int'l Joint Research] カレル大学(チェコ)

    • Related Report
      2019 Annual Research Report
  • [Journal Article] 内容アドレッシングを用いた多粒度漢字構造情報表現の試み2020

    • Author(s)
      守岡知彦
    • Journal Title

      情報処理学会論文誌

      Volume: 61(2) Pages: 171-178

    • NAID

      170000181671

    • Related Report
      2019 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 漢文自動訓読ツールUD-Kundokuの開発2020

    • Author(s)
      安岡孝一
    • Journal Title

      東洋学へのコンピュータ利用

      Volume: 32 Pages: 3-25

    • NAID

      120006810852

    • Related Report
      2019 Annual Research Report
    • Open Access
  • [Journal Article] Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み2019

    • Author(s)
      安岡孝一
    • Journal Title

      情報処理学会研究報告

      Volume: 2019-CH-120(1) Pages: 1-8

    • Related Report
      2019 Annual Research Report
    • Open Access
  • [Journal Article] 古典中国語のテクストをいかに切り分けるか2019

    • Author(s)
      山崎直樹
    • Journal Title

      開篇

      Volume: 37 Pages: 111-119

    • Related Report
      2019 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Universal Dependencies Treebank of the Four Books in Classical Chinese2019

    • Author(s)
      Koichi Yasuoka
    • Journal Title

      Proceedings of International Conference of Digital Archives and Digital Humanities

      Volume: DADH2019 Pages: 20-28

    • NAID

      120006775913

    • Related Report
      2019 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 漢日英Universal Dependencies平行コーパスとその差異2019

    • Author(s)
      安岡孝一
    • Journal Title

      人文科学とコンピュータシンポジウム論文集

      Volume: 2019(1) Pages: 43-50

    • NAID

      120006775914

    • Related Report
      2019 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 漢文の形態素解析・依存文法解析・直接構成鎖解析2019

    • Author(s)
      安岡孝一
    • Journal Title

      東方學報

      Volume: 94 Pages: 330-322

    • NAID

      120006841433

    • Related Report
      2019 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 古典中国語Universal Dependenciesで読む『孟子』2019

    • Author(s)
      安岡孝一
    • Journal Title

      センター研究年報(京都大学人文科学研究所附属東アジア人文情報学研究センター)

      Volume: 2018別冊 Pages: 1-519

    • Related Report
      2018 Annual Research Report
    • Open Access
  • [Journal Article] 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか2019

    • Author(s)
      安岡孝一
    • Journal Title

      東洋学へのコンピュータ利用

      Volume: 30 Pages: 3-110

    • NAID

      120006705732

    • Related Report
      2018 Annual Research Report
    • Open Access
  • [Journal Article] 古典中国語UDコーパスのIPFSを用いた表現の試み2018

    • Author(s)
      守岡知彦
    • Journal Title

      情報処理学会研究報告

      Volume: 2018-CH-118(6) Pages: 1-7

    • NAID

      120006621573

    • Related Report
      2018 Annual Research Report
    • Open Access
  • [Journal Article] 古典中国語(漢文)の依存文法解析と直接構成素解析2018

    • Author(s)
      安岡孝一
    • Journal Title

      漢字文献情報処理研究

      Volume: 18 Pages: 56-62

    • Related Report
      2018 Annual Research Report
    • Open Access
  • [Journal Article] 形態素解析とは何か2018

    • Author(s)
      師茂樹
    • Journal Title

      漢字文献情報処理研究

      Volume: 18 Pages: 42-45

    • Related Report
      2018 Annual Research Report
    • Open Access
  • [Journal Article] 漢文の依存文法解析と返り点の関係について2018

    • Author(s)
      安岡孝一
    • Journal Title

      日本漢字学会研究大会予稿集

      Volume: 1 Pages: 33-48

    • NAID

      120006543400

    • Related Report
      2018 Annual Research Report
    • Open Access
  • [Journal Article] 古典中国語(漢文)の形態素解析とその応用2018

    • Author(s)
      安岡孝一、ウィッテルン クリスティアン、守岡知彦、池田巧、山崎直樹、二階堂善弘、鈴木慎吾、師茂樹
    • Journal Title

      情報処理学会論文誌

      Volume: 59(2) Pages: 323-331

    • NAID

      120006394776

    • Related Report
      2017 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Universal Dependenciesにもとづく古典中国語(漢文)の依存文法解析2018

    • Author(s)
      安岡孝一
    • Journal Title

      センター研究年報(京都大学人文科学研究所附属東アジア人文情報学研究センター)

      Volume: 2018 Pages: 1-104

    • Related Report
      2017 Annual Research Report
    • Open Access
  • [Journal Article] 古典中国語Universal Dependenciesへの挑戦2018

    • Author(s)
      安岡孝一、ウィッテルン クリスティアン、守岡知彦、池田巧、山崎直樹、二階堂善弘、鈴木慎吾、師茂樹
    • Journal Title

      情報処理学会研究報告

      Volume: 2018-CH-116(20) Pages: 1-8

    • NAID

      120006382568

    • Related Report
      2017 Annual Research Report
    • Open Access
  • [Presentation] 漢文古典文献を分析するためのツールの普及に向けた取り組み2020

    • Author(s)
      師茂樹
    • Organizer
      漢字文献情報処理研究会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 漢文自動訓読ツールUD-Kundokuの開発2020

    • Author(s)
      安岡孝一
    • Organizer
      東洋学へのコンピュータ利用
    • Related Report
      2019 Annual Research Report
  • [Presentation] AIを用いた漢文の文法解析2019

    • Author(s)
      安岡孝一
    • Organizer
      日本中国学会・KU-ORCASシンポジウム
    • Related Report
      2019 Annual Research Report
    • Invited
  • [Presentation] Universal Dependencies Treebank of the Four Books in Classical Chinese2019

    • Author(s)
      Koichi Yasuoka
    • Organizer
      DADH 2019: 10th International Conference of Digital Archives and Digital Humanities
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み2019

    • Author(s)
      安岡孝一
    • Organizer
      人文科学とコンピュータ
    • Related Report
      2019 Annual Research Report
  • [Presentation] 漢籍研究環境の変容と今後の課題2019

    • Author(s)
      二階堂善弘
    • Organizer
      情報化時代の東洋学研究―デジタルアーカイブスの現状と課題―
    • Related Report
      2019 Annual Research Report
  • [Presentation] 漢日英Universal Dependencies平行コーパスとその差異2019

    • Author(s)
      安岡孝一
    • Organizer
      人文科学とコンピュータシンポジウム「じんもんこん2019」
    • Related Report
      2019 Annual Research Report
  • [Presentation] 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか2019

    • Author(s)
      安岡孝一
    • Organizer
      東洋学へのコンピュータ利用第30回研究セミナー
    • Related Report
      2018 Annual Research Report
  • [Presentation] 古典中国語UDコーパスのIPFSを用いた表現の試み2018

    • Author(s)
      守岡知彦
    • Organizer
      情報処理学会『人文科学とコンピュータ』研究会
    • Related Report
      2018 Annual Research Report
  • [Presentation] 漢文の依存文法解析と返り点の関係について2018

    • Author(s)
      安岡孝一
    • Organizer
      日本漢字学会
    • Related Report
      2018 Annual Research Report
  • [Presentation] 古典中国語Universal Dependenciesへの挑戦2018

    • Author(s)
      安岡孝一
    • Organizer
      情報処理学会『人文科学とコンピュータ』研究会
    • Related Report
      2017 Annual Research Report
  • [Remarks] 「東アジア古典文献コーパスの実証研究」ログ

    • URL

      http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/archive2020.html

    • Related Report
      2019 Annual Research Report
  • [Remarks] Classical Chinese corpus on Universal Dependencies

    • URL

      https://corpus.kanji.zinbun.kyoto-u.ac.jp/gitlab/Kanbun/ud-kanbun/

    • Related Report
      2018 Annual Research Report

URL: 

Published: 2017-04-28   Modified: 2021-02-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi