• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

古典漢文形態素コーパスにもとづく動詞の作用域の自動抽出

研究課題

研究課題/領域番号 17H01835
研究機関京都大学

研究代表者

安岡 孝一  京都大学, 人文科学研究所, 教授 (20230211)

研究分担者 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード文法解析 / 古典中国語
研究実績の概要

古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを自動抽出すべく、文法記述手法と自動抽出手法の検討をおこなった。具体的には、Мельчук流の依存文法による記述手法の一つであるUniversal Dependenciesを用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の全文コーパスを作成した。これらの全文コーパスを、京都大学人文科学研究所附属東アジア人文情報学研究センターのGitLabからWWW公開すると同時に、プラハ・カレル大学との国際連携により、Universal Dependencies 2.4およびUniversal Dependencies 2.5の一部として、WWW公開した。
また、形態素解析エンジンMeCabと依存文法解析エンジンUDPipeを組み合わせて、古典漢文における動詞の作用域抽出のみならず、動詞・名詞間の係り受け解析をおこなうツールを作成し、UD-KanbunというpythonモジュールとしてWWW公開した。このUD-Kanbunのさらなる応用として、動詞の作用域にもとづいて漢文の返り点を自動抽出し、抽出した動詞に日本語の活用語尾を自動で付加し、さらには抽出した名詞に日本語の助詞を自動で付加することで、漢文の自動訓読をおこなうツールを試作し、UD-KundokuというpythonモジュールとしてWWW公開した。さらにデモンストレーションとして、令和2年1月の大学入試センター試験「国語」の第4問(本文)から返り点と送り仮名を除去し、あらためてUD-Kundokuで処理したところ、かなり高い精度で自動訓読できることが実証された。

現在までの達成度 (段落)

令和元年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和元年度が最終年度であるため、記入しない。

  • 研究成果

    (16件)

すべて 2020 2019 その他

すべて 国際共同研究 (1件) 雑誌論文 (7件) (うちオープンアクセス 6件、 査読あり 5件) 学会発表 (7件) (うち国際学会 1件、 招待講演 1件) 備考 (1件)

  • [国際共同研究] カレル大学(チェコ)

    • 国名
      チェコ
    • 外国機関名
      カレル大学
  • [雑誌論文] 内容アドレッシングを用いた多粒度漢字構造情報表現の試み2020

    • 著者名/発表者名
      守岡知彦
    • 雑誌名

      情報処理学会論文誌

      巻: 61(2) ページ: 171-178

    • 査読あり / オープンアクセス
  • [雑誌論文] 漢文自動訓読ツールUD-Kundokuの開発2020

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      東洋学へのコンピュータ利用

      巻: 32 ページ: 3-25

    • オープンアクセス
  • [雑誌論文] Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み2019

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      情報処理学会研究報告

      巻: 2019-CH-120(1) ページ: 1-8

    • オープンアクセス
  • [雑誌論文] 古典中国語のテクストをいかに切り分けるか2019

    • 著者名/発表者名
      山崎直樹
    • 雑誌名

      開篇

      巻: 37 ページ: 111-119

    • 査読あり
  • [雑誌論文] Universal Dependencies Treebank of the Four Books in Classical Chinese2019

    • 著者名/発表者名
      Koichi Yasuoka
    • 雑誌名

      Proceedings of International Conference of Digital Archives and Digital Humanities

      巻: DADH2019 ページ: 20-28

    • 査読あり / オープンアクセス
  • [雑誌論文] 漢日英Universal Dependencies平行コーパスとその差異2019

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      人文科学とコンピュータシンポジウム論文集

      巻: 2019(1) ページ: 43-50

    • 査読あり / オープンアクセス
  • [雑誌論文] 漢文の形態素解析・依存文法解析・直接構成鎖解析2019

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      東方學報

      巻: 94 ページ: 330-322

    • 査読あり / オープンアクセス
  • [学会発表] 漢文古典文献を分析するためのツールの普及に向けた取り組み2020

    • 著者名/発表者名
      師茂樹
    • 学会等名
      漢字文献情報処理研究会
  • [学会発表] 漢文自動訓読ツールUD-Kundokuの開発2020

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      東洋学へのコンピュータ利用
  • [学会発表] AIを用いた漢文の文法解析2019

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      日本中国学会・KU-ORCASシンポジウム
    • 招待講演
  • [学会発表] Universal Dependencies Treebank of the Four Books in Classical Chinese2019

    • 著者名/発表者名
      Koichi Yasuoka
    • 学会等名
      DADH 2019: 10th International Conference of Digital Archives and Digital Humanities
    • 国際学会
  • [学会発表] Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み2019

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      人文科学とコンピュータ
  • [学会発表] 漢籍研究環境の変容と今後の課題2019

    • 著者名/発表者名
      二階堂善弘
    • 学会等名
      情報化時代の東洋学研究―デジタルアーカイブスの現状と課題―
  • [学会発表] 漢日英Universal Dependencies平行コーパスとその差異2019

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      人文科学とコンピュータシンポジウム「じんもんこん2019」
  • [備考] 「東アジア古典文献コーパスの実証研究」ログ

    • URL

      http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/archive2020.html

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi