• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 研究成果報告書

古典漢文依存文法コーパスにもとづく係り受け構造の自動抽出

研究課題

  • PDF
研究課題/領域番号 20H04481
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関京都大学

研究代表者

安岡 孝一  京都大学, 人文科学研究所, 教授 (20230211)

研究分担者 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 教授 (70351294)
Wittern C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
白須 裕之  京都大学, 人文科学研究所, 助教 (30828570)
鈴木 慎吾  大阪大学, 大学院人文学研究科(外国学専攻、日本学専攻), 准教授 (20513360)
研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード言語処理 / 古典漢文
研究成果の概要

古典漢文の白文(単なる漢字の列)に対し、文切り、単語の組み上げ、品詞付与、単語間の係り受け解析、節の組み上げ、節間の係り受け解析、をおこなう手法を開発した。この手法を、言語モデルRoBERTa-Classical-Chineseをチューニングする形で、実装・公開をおこなった。また、この手法が、ベトナム語やタイ語にも適用可能であったことから、同様に実装・公開をおこなった。

自由記述の分野

人文情報学

研究成果の学術的意義や社会的意義

学術的意義としては、古典漢文の白文(単なる漢字の列)が、本研究の手法により、文・節・単語の単位に区切ることが出来るようになる上に、それらの関係(どの単語が動詞で、その主語や目的語はどれなのか、など)が、非常に高い精度で自動解析できるようになった。
一方、社会的意義としては、本研究の手法が、ベトナム語やタイ語にも適用可能であるという点が挙げられる。ベトナム語もタイ語も、単語の切れ目すら見極めるのが難しい言語であり、それが自動解析できるようになる意義は大きい。

URL: 

公開日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi