• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出

Research Project

Project/Area Number 17H01835
Research InstitutionKyoto University

Principal Investigator

安岡 孝一  京都大学, 人文科学研究所, 教授 (20230211)

Co-Investigator(Kenkyū-buntansha) 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywords文法解析 / 古典中国語
Outline of Annual Research Achievements

古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを自動抽出すべく、文法記述手法と自動抽出手法の検討をおこなった。具体的には、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesを用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の全文コーパスを作成した。これらの全文コーパスを、京都大学人文科学研究所附属東アジア人文情報学研究センターのGitLabからWWW公開すると同時に、プラハ・カレル大学との国際連携により、Universal Dependencies 2.4およびUniversal Dependencies 2.5の一部として、WWW公開した。
また、形態素解析エンジンMeCabと依存文法解析エンジンUDPipeを組み合わせて、古典漢文における動詞の作用域抽出のみならず、動詞・名詞間の係り受け解析をおこなうツールを作成し、UD-KanbunというpythonモジュールとしてWWW公開した。このUD-Kanbunのさらなる応用として、動詞の作用域にもとづいて漢文の返り点を自動抽出し、抽出した動詞に日本語の活用語尾を自動で付加し、さらには抽出した名詞に日本語の助詞を自動で付加することで、漢文の自動訓読をおこなうツールを試作し、UD-KundokuというpythonモジュールとしてWWW公開した。さらにデモンストレーションとして、令和2年1月の大学入試センター試験「国語」の第4問(本文)から返り点と送り仮名を除去し、あらためてUD-Kundokuで処理したところ、かなり高い精度で自動訓読できることが実証された。

Research Progress Status

令和元年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和元年度が最終年度であるため、記入しない。

  • Research Products

    (16 results)

All 2020 2019 Other

All Int'l Joint Research (1 results) Journal Article (7 results) (of which Open Access: 6 results,  Peer Reviewed: 5 results) Presentation (7 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results) Remarks (1 results)

  • [Int'l Joint Research] カレル大学(チェコ)

    • Country Name
      CZECH
    • Counterpart Institution
      カレル大学
  • [Journal Article] 内容アドレッシングを用いた多粒度漢字構造情報表現の試み2020

    • Author(s)
      守岡知彦
    • Journal Title

      情報処理学会論文誌

      Volume: 61(2) Pages: 171-178

    • Peer Reviewed / Open Access
  • [Journal Article] 漢文自動訓読ツールUD-Kundokuの開発2020

    • Author(s)
      安岡孝一
    • Journal Title

      東洋学へのコンピュータ利用

      Volume: 32 Pages: 3-25

    • Open Access
  • [Journal Article] Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み2019

    • Author(s)
      安岡孝一
    • Journal Title

      情報処理学会研究報告

      Volume: 2019-CH-120(1) Pages: 1-8

    • Open Access
  • [Journal Article] 古典中国語のテクストをいかに切り分けるか2019

    • Author(s)
      山崎直樹
    • Journal Title

      開篇

      Volume: 37 Pages: 111-119

    • Peer Reviewed
  • [Journal Article] Universal Dependencies Treebank of the Four Books in Classical Chinese2019

    • Author(s)
      Koichi Yasuoka
    • Journal Title

      Proceedings of International Conference of Digital Archives and Digital Humanities

      Volume: DADH2019 Pages: 20-28

    • Peer Reviewed / Open Access
  • [Journal Article] 漢日英Universal Dependencies平行コーパスとその差異2019

    • Author(s)
      安岡孝一
    • Journal Title

      人文科学とコンピュータシンポジウム論文集

      Volume: 2019(1) Pages: 43-50

    • Peer Reviewed / Open Access
  • [Journal Article] 漢文の形態素解析・依存文法解析・直接構成鎖解析2019

    • Author(s)
      安岡孝一
    • Journal Title

      東方學報

      Volume: 94 Pages: 330-322

    • Peer Reviewed / Open Access
  • [Presentation] 漢文古典文献を分析するためのツールの普及に向けた取り組み2020

    • Author(s)
      師茂樹
    • Organizer
      漢字文献情報処理研究会
  • [Presentation] 漢文自動訓読ツールUD-Kundokuの開発2020

    • Author(s)
      安岡孝一
    • Organizer
      東洋学へのコンピュータ利用
  • [Presentation] AIを用いた漢文の文法解析2019

    • Author(s)
      安岡孝一
    • Organizer
      日本中国学会・KU-ORCASシンポジウム
    • Invited
  • [Presentation] Universal Dependencies Treebank of the Four Books in Classical Chinese2019

    • Author(s)
      Koichi Yasuoka
    • Organizer
      DADH 2019: 10th International Conference of Digital Archives and Digital Humanities
    • Int'l Joint Research
  • [Presentation] Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み2019

    • Author(s)
      安岡孝一
    • Organizer
      人文科学とコンピュータ
  • [Presentation] 漢籍研究環境の変容と今後の課題2019

    • Author(s)
      二階堂善弘
    • Organizer
      情報化時代の東洋学研究―デジタルアーカイブスの現状と課題―
  • [Presentation] 漢日英Universal Dependencies平行コーパスとその差異2019

    • Author(s)
      安岡孝一
    • Organizer
      人文科学とコンピュータシンポジウム「じんもんこん2019」
  • [Remarks] 「東アジア古典文献コーパスの実証研究」ログ

    • URL

      http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/archive2020.html

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi