• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Application of computational linguistic techniques to Medieval and Modern Spanish texts

Research Project

Project/Area Number 23K12152
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 02060:Linguistics-related
Research InstitutionThe University of Tokyo

Principal Investigator

川崎 義史  東京大学, 大学院総合文化研究科, 准教授 (40794756)

Project Period (FY) 2023-04-01 – 2028-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2027: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2026: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2025: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywordsスペイン語 / ロマンス語 / カタルーニャ語 / 計量文献学 / 計算言語学 / 意味変化 / 文法化 / 言語変化
Outline of Research at the Start

本研究では,中近世スペイン語文献を計算言語学の手法で分析し,新たな知見を掘り起こすことを目指す。具体的には,次の3つの課題に取り組む:
課題①中近世スペイン語文学作品の著者推定:成立過程が不明確な文献の真の作者や執筆人数を統計的手法により推定する。
課題②中近世スペイン語古文書の年代推定・地点推定:古文書がいつ・どこで作成されたかを言語的特徴に基づき統計的に推定する。
課題③ラテン語からロマンス語への通時変化のモデル化:文献資料が豊富なロマンス語を対象として,数理的手法やシミュレーション技法を用いて言語変化の蓋然性を検証する。

Outline of Annual Research Achievements

課題①中近世スペイン語文学作品の著者推定:中世カタルーニャ語騎士道小説の金字塔『ティラン・ロ・ブラン』の作者は複数人ではなく一人である可能性が高いことを計量的分析により示した。本作品について,これまで文献学の見地から単一作者説と複数作者説が提起されてきた。計量文献学の見地からは複数作者説が有力視されていた。しかし,先行研究には,地の文と会話部の区別を無視しているいう欠点があった。本研究では,両者を区別しつつ,品詞n-gramを特徴量として教師なし学習を行った。分析の結果,単一作者説の可能性が高いことが判明した。研究成果は国際会議NLP4DH&IWCLUL2023で発表した。
課題②中近世スペイン語古文書の年代推定・地点推定には着手できなかった。
課題③ラテン語からロマンス語への通時変化のモデル化:(1)単語の分散表現を用いて意味変化の統計的法則が1000年以上成り立つことを示した。先行研究では200年程度だった法則の成立期間を大幅に伸ばした点に意義がある。この研究で言語処理学会の委員特別賞を受賞した;(2)対象言語が英語になるが,単語の分散表現とフォン・ミーゼス分布を用いて意味の集中度を定義し,それに基づき意味変化を検出する手法を提案した。単純な手法であるにも関わらず,最高性能の検出力を達成した。研究成果は言語処理学会と国際会議EMNLP2023で発表した;(3)同じく対象言語が英語になるが,単語の分散表現を用いて英語の動詞派生前置詞の文法化度を定量化することに成功した。文法化の定量化は世界初の試みである。この研究で言語処理学会の優秀賞を受賞した。
この他,数理的手法による言語変異・変化の研究を主題とした国際研究集会Complexity in Language Variation and Change(COMPILA2023)を海外の研究者と共同開催した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

課題②中近世スペイン語古文書の年代推定・地点推定は遅れているが,その他の実施予定の研究課題は順調に進んでいる。また,当初予定していなかった新たな関連研究課題を発掘することができた。

Strategy for Future Research Activity

課題①中近世スペイン語文学作品の著者推定:『贋作ドン・キホーテ』の計量文献学的分析を完了させる。
課題②中近世スペイン語古文書の年代推定・地点推定:未着手のデータ整理を進める。
課題③ラテン語からロマンス語への通時変化のモデル化:系列変換モデルによるラテン語からロマンス語への形態的変化の分析を完了させる。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (7 results)

All 2024 2023 Other

All Journal Article (5 results) (of which Peer Reviewed: 2 results,  Open Access: 5 results) Remarks (1 results) Funded Workshop (1 results)

  • [Journal Article] 意味変化の統計的法則は1000年成り立つ2024

    • Author(s)
      川崎義史, 高村大也, 永田亮
    • Journal Title

      言語処理学会第30回年次大会発表論文集

      Volume: - Pages: 1610-1615

    • Related Report
      2023 Research-status Report
    • Open Access
  • [Journal Article] 意味の集中度に基づいた意味変化検出2024

    • Author(s)
      永田亮, 高村大也, 大谷直輝, 川崎義史
    • Journal Title

      言語処理学会第30回年次大会発表論文集

      Volume: - Pages: 1622-1627

    • Related Report
      2023 Research-status Report
    • Open Access
  • [Journal Article] 動詞派生前置詞の文法化の定量化2024

    • Author(s)
      永田亮, 川崎義史, 大谷直輝, 高村大也
    • Journal Title

      言語処理学会第30回年次大会発表論文集

      Volume: - Pages: 1628-1633

    • Related Report
      2023 Research-status Report
    • Open Access
  • [Journal Article] Revisiting Authorship Attribution of Tirant lo Blanc Using Parts of Speech n-grams2023

    • Author(s)
      Yoshifumi Kawasaki
    • Journal Title

      Proceedings of the the Joint 3rd International Conference on Natural Language Processing for Digital Humanities & 8th International Workshop on Computational Linguistics for Uralic Languages

      Volume: - Pages: 16-26

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Variance Matters: Detecting Semantic Differences without Corpus/Word Alignment2023

    • Author(s)
      Nagata Ryo, Takamura Hiroya, Otani Naoki, Kawasaki Yoshifumi
    • Journal Title

      Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing

      Volume: - Pages: 15609-15622

    • DOI

      10.18653/v1/2023.emnlp-main.965

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Remarks] researchmap

    • URL

      https://researchmap.jp/16211665/

    • Related Report
      2023 Research-status Report
  • [Funded Workshop] Complexity in Language Variation and Change (COMPILA 2023)2023

    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi