• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

古典漢文依存文法コーパスにもとづく係り受け構造の自動抽出

研究課題

研究課題/領域番号 20H04481
研究機関京都大学

研究代表者

安岡 孝一  京都大学, 人文科学研究所, 教授 (20230211)

研究分担者 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
白須 裕之  京都大学, 人文科学研究所, 助教 (30828570)
鈴木 慎吾  大阪大学, 大学院人文学研究科(外国学専攻、日本学専攻), 准教授 (20513360)
研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード言語処理 / 古典漢文 / 孤立語
研究実績の概要

本研究は、これまでわれわれがおこなってきた古典漢文の形態素解析および依存文法解析を、さらにもう一歩進めて、古典漢文の構文解析へとつなげることを目的とする。現在のところ、現代中国語に対しては、このような形態素解析・構文解析の研究がおこなわれているものの、古典漢文に対しては、われわれを除いてほとんど手つかずの状態である。本研究によって、古典漢文の係り受け構造を、単語と単語の間、節と節の間、さらには文と文の間にまで自動抽出できるようになれば、白文のままで放置されている大量の古典漢文テキストを、コンピュータを用いて自然言語処理できる可能性が、さらに進むと考えられる。
本年度(2022年度)は、古典漢文に対し形態素解析と依存文法解析をおこなった上で、単語と単語の間の係り受け関係、節と節の間の係り受け関係を、自動抽出する手法の構築をおこなった。さらにこの手法を、transformers上のRoBERTaモデルで再実装をおこない、文と文との関係記述をおこなう手法の開発をおこなった。具体的には、RoBERTaモデル上に単語間の有向グラフを構築し、この有向グラフの接続確率が最大となるようなUniversal Dependenciesの木構造を抽出する、という手法を実装した。
また、この手法を、古典漢文以外の孤立語へと援用することを試み、タイ語とベトナム語への手法拡張を試してみた。結果として、ベトナム語への拡張は思いのほかうまくいったものの、タイ語への拡張はあまりうまくいかなかった。

現在までの達成度 (段落)

令和4年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和4年度が最終年度であるため、記入しない。

  • 研究成果

    (7件)

すべて 2023 2022 その他

すべて 国際共同研究 (1件) 雑誌論文 (4件) (うち査読あり 2件、 オープンアクセス 4件) 学会発表 (1件) (うち国際学会 1件、 招待講演 1件) 備考 (1件)

  • [国際共同研究] カレル大学(チェコ)

    • 国名
      チェコ
    • 外国機関名
      カレル大学
  • [雑誌論文] Sequence-Labeling RoBERTa Model for Dependency-Parsing in Classical Chinese and Its Application to Vietnamese and Thai2023

    • 著者名/発表者名
      Yasuoka Koichi
    • 雑誌名

      8th International Conference on Business and Industrial Research

      巻: ICBIR 2023 ページ: 169-173

    • DOI

      10.1109/ICBIR57571.2023.10147628

    • 査読あり / オープンアクセス
  • [雑誌論文] Universal DependenciesとBERT/RoBERTaモデルによる古典中国語情報処理 (in Korean)2022

    • 著者名/発表者名
      安岡 孝一
    • 雑誌名

      Journal of Applied Studies on Sinograph and Literary Sinitic

      巻: 1 ページ: 127-163

    • DOI

      10.26523/HERC.2022.1.127

    • 査読あり / オープンアクセス
  • [雑誌論文] 古典中国語の形態素解析と係り受け解析2022

    • 著者名/発表者名
      安岡 孝一, 安岡 素子
    • 雑誌名

      槿域漢文学会2022年秋季企画学術大会

      巻: 2022 ページ: 171-183

    • オープンアクセス
  • [雑誌論文] 画像とテキストの位置づけ2022

    • 著者名/発表者名
      二階堂善弘
    • 雑誌名

      KU-ORCASが開くデジタル化時代の東アジア文化研究

      巻: 2022 ページ: 123-130

    • DOI

      10.32286/00026586

    • オープンアクセス
  • [学会発表] 古典中国語の形態素解析と係り受け解析2022

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      槿域漢文学会2022年秋季企画学術大会
    • 国際学会 / 招待講演
  • [備考] 「古典中国語のコーパスの研究」共同研究班ログ

    • URL

      http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/archive2023.html

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi