• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出

研究課題

研究課題/領域番号 17H01835
研究機関京都大学

研究代表者

安岡 孝一  京都大学, 人文科学研究所, 教授 (20230211)

研究分担者 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード文法解析 / 古典中国語
研究実績の概要

古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを、自動抽出すべく、複文(動詞の作用域の中に他の動詞を含む文)に対して、文法記述手法と自動抽出手法の検討をおこなった。具体的には、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesを用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の全文記述をおこなった。これらの全文記述を、そのまま古典漢文Treebankの形に仕上げ、WWWで公開すると同時に、『孟子』についてはセンター研究年報2018別冊「古典中国語Universal Dependenciesで読む『孟子』」として出版・公表した。
このTreebankをもとに、形態素解析エンジンMeCabと依存文法解析エンジンUDPipeを組み合わせて、古典漢文における動詞の作用域を自動抽出するツールを試作した。このツールを公開するにあたり、本手法の応用の一つとして、漢文の白文に自動で返り点を打つページをWWWで公開した。さらに、デモンストレーションとして、ここ5年間の大学入試センター試験「国語」の第4問(漢文)の本文から返り点を除去し、あらためて本研究の手法で返り点を打ってみせたところ、かなりの確度で返り点を打てることが実証された。
また、平成30年1月に情報処理学会「人文科学とコンピュータ」研究会で発表した『古典中国語Universal Dependenciesへの挑戦』に対し、本年度の情報処理学会第81回全国大会において、山下研究記念賞を受賞し表彰を受けた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

単文における「動詞の作用域」に続いて、複文における「動詞の作用域」もほぼ抽出可能となっており、順調に進展していると言える。

今後の研究の推進方策

本手法の「動詞の作用域」の抽出精度をさらに上げると同時に、コピュラ文(動詞を含まない)の補語に、動詞を含んだ文が用いられているようなケースにおいて、本手法が拡張可能かどうか挑戦する。

  • 研究成果

    (10件)

すべて 2019 2018 その他

すべて 雑誌論文 (6件) (うちオープンアクセス 6件) 学会発表 (3件) 備考 (1件)

  • [雑誌論文] 古典中国語Universal Dependenciesで読む『孟子』2019

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      センター研究年報(京都大学人文科学研究所附属東アジア人文情報学研究センター)

      巻: 2018別冊 ページ: 1-519

    • オープンアクセス
  • [雑誌論文] 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか2019

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      東洋学へのコンピュータ利用

      巻: 30 ページ: 3-110

    • オープンアクセス
  • [雑誌論文] 古典中国語UDコーパスのIPFSを用いた表現の試み2018

    • 著者名/発表者名
      守岡知彦
    • 雑誌名

      情報処理学会研究報告

      巻: 2018-CH-118(6) ページ: 1-7

    • オープンアクセス
  • [雑誌論文] 古典中国語(漢文)の依存文法解析と直接構成素解析2018

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      漢字文献情報処理研究

      巻: 18 ページ: 56-62

    • オープンアクセス
  • [雑誌論文] 形態素解析とは何か2018

    • 著者名/発表者名
      師茂樹
    • 雑誌名

      漢字文献情報処理研究

      巻: 18 ページ: 42-45

    • オープンアクセス
  • [雑誌論文] 漢文の依存文法解析と返り点の関係について2018

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      日本漢字学会研究大会予稿集

      巻: 1 ページ: 33-48

    • オープンアクセス
  • [学会発表] 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか2019

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      東洋学へのコンピュータ利用第30回研究セミナー
  • [学会発表] 古典中国語UDコーパスのIPFSを用いた表現の試み2018

    • 著者名/発表者名
      守岡知彦
    • 学会等名
      情報処理学会『人文科学とコンピュータ』研究会
  • [学会発表] 漢文の依存文法解析と返り点の関係について2018

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      日本漢字学会
  • [備考] Classical Chinese corpus on Universal Dependencies

    • URL

      https://corpus.kanji.zinbun.kyoto-u.ac.jp/gitlab/Kanbun/ud-kanbun/

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi