• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出

Research Project

Project/Area Number 17H01835
Research InstitutionKyoto University

Principal Investigator

安岡 孝一  京都大学, 人文科学研究所, 教授 (20230211)

Co-Investigator(Kenkyū-buntansha) 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywords文法解析 / 古典中国語
Outline of Annual Research Achievements

古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを、自動抽出すべく、複文(動詞の作用域の中に他の動詞を含む文)に対して、文法記述手法と自動抽出手法の検討をおこなった。具体的には、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesを用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の全文記述をおこなった。これらの全文記述を、そのまま古典漢文Treebankの形に仕上げ、WWWで公開すると同時に、『孟子』についてはセンター研究年報2018別冊「古典中国語Universal Dependenciesで読む『孟子』」として出版・公表した。
このTreebankをもとに、形態素解析エンジンMeCabと依存文法解析エンジンUDPipeを組み合わせて、古典漢文における動詞の作用域を自動抽出するツールを試作した。このツールを公開するにあたり、本手法の応用の一つとして、漢文の白文に自動で返り点を打つページをWWWで公開した。さらに、デモンストレーションとして、ここ5年間の大学入試センター試験「国語」の第4問(漢文)の本文から返り点を除去し、あらためて本研究の手法で返り点を打ってみせたところ、かなりの確度で返り点を打てることが実証された。
また、平成30年1月に情報処理学会「人文科学とコンピュータ」研究会で発表した『古典中国語Universal Dependenciesへの挑戦』に対し、本年度の情報処理学会第81回全国大会において、山下研究記念賞を受賞し表彰を受けた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

単文における「動詞の作用域」に続いて、複文における「動詞の作用域」もほぼ抽出可能となっており、順調に進展していると言える。

Strategy for Future Research Activity

本手法の「動詞の作用域」の抽出精度をさらに上げると同時に、コピュラ文(動詞を含まない)の補語に、動詞を含んだ文が用いられているようなケースにおいて、本手法が拡張可能かどうか挑戦する。

  • Research Products

    (10 results)

All 2019 2018 Other

All Journal Article (6 results) (of which Open Access: 6 results) Presentation (3 results) Remarks (1 results)

  • [Journal Article] 古典中国語Universal Dependenciesで読む『孟子』2019

    • Author(s)
      安岡孝一
    • Journal Title

      センター研究年報(京都大学人文科学研究所附属東アジア人文情報学研究センター)

      Volume: 2018別冊 Pages: 1-519

    • Open Access
  • [Journal Article] 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか2019

    • Author(s)
      安岡孝一
    • Journal Title

      東洋学へのコンピュータ利用

      Volume: 30 Pages: 3-110

    • Open Access
  • [Journal Article] 古典中国語UDコーパスのIPFSを用いた表現の試み2018

    • Author(s)
      守岡知彦
    • Journal Title

      情報処理学会研究報告

      Volume: 2018-CH-118(6) Pages: 1-7

    • Open Access
  • [Journal Article] 古典中国語(漢文)の依存文法解析と直接構成素解析2018

    • Author(s)
      安岡孝一
    • Journal Title

      漢字文献情報処理研究

      Volume: 18 Pages: 56-62

    • Open Access
  • [Journal Article] 形態素解析とは何か2018

    • Author(s)
      師茂樹
    • Journal Title

      漢字文献情報処理研究

      Volume: 18 Pages: 42-45

    • Open Access
  • [Journal Article] 漢文の依存文法解析と返り点の関係について2018

    • Author(s)
      安岡孝一
    • Journal Title

      日本漢字学会研究大会予稿集

      Volume: 1 Pages: 33-48

    • Open Access
  • [Presentation] 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか2019

    • Author(s)
      安岡孝一
    • Organizer
      東洋学へのコンピュータ利用第30回研究セミナー
  • [Presentation] 古典中国語UDコーパスのIPFSを用いた表現の試み2018

    • Author(s)
      守岡知彦
    • Organizer
      情報処理学会『人文科学とコンピュータ』研究会
  • [Presentation] 漢文の依存文法解析と返り点の関係について2018

    • Author(s)
      安岡孝一
    • Organizer
      日本漢字学会
  • [Remarks] Classical Chinese corpus on Universal Dependencies

    • URL

      https://corpus.kanji.zinbun.kyoto-u.ac.jp/gitlab/Kanbun/ud-kanbun/

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi