研究課題/領域番号 |
23K12152
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 東京大学 |
研究代表者 |
川崎 義史 東京大学, 大学院総合文化研究科, 准教授 (40794756)
|
研究期間 (年度) |
2023-04-01 – 2028-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2027年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2026年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2025年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | スペイン語 / ロマンス語 / カタルーニャ語 / 計量文献学 / 計算言語学 / 意味変化 / 文法化 / 言語変化 |
研究開始時の研究の概要 |
本研究では,中近世スペイン語文献を計算言語学の手法で分析し,新たな知見を掘り起こすことを目指す。具体的には,次の3つの課題に取り組む: 課題①中近世スペイン語文学作品の著者推定:成立過程が不明確な文献の真の作者や執筆人数を統計的手法により推定する。 課題②中近世スペイン語古文書の年代推定・地点推定:古文書がいつ・どこで作成されたかを言語的特徴に基づき統計的に推定する。 課題③ラテン語からロマンス語への通時変化のモデル化:文献資料が豊富なロマンス語を対象として,数理的手法やシミュレーション技法を用いて言語変化の蓋然性を検証する。
|
研究実績の概要 |
課題①中近世スペイン語文学作品の著者推定:中世カタルーニャ語騎士道小説の金字塔『ティラン・ロ・ブラン』の作者は複数人ではなく一人である可能性が高いことを計量的分析により示した。本作品について,これまで文献学の見地から単一作者説と複数作者説が提起されてきた。計量文献学の見地からは複数作者説が有力視されていた。しかし,先行研究には,地の文と会話部の区別を無視しているいう欠点があった。本研究では,両者を区別しつつ,品詞n-gramを特徴量として教師なし学習を行った。分析の結果,単一作者説の可能性が高いことが判明した。研究成果は国際会議NLP4DH&IWCLUL2023で発表した。 課題②中近世スペイン語古文書の年代推定・地点推定には着手できなかった。 課題③ラテン語からロマンス語への通時変化のモデル化:(1)単語の分散表現を用いて意味変化の統計的法則が1000年以上成り立つことを示した。先行研究では200年程度だった法則の成立期間を大幅に伸ばした点に意義がある。この研究で言語処理学会の委員特別賞を受賞した;(2)対象言語が英語になるが,単語の分散表現とフォン・ミーゼス分布を用いて意味の集中度を定義し,それに基づき意味変化を検出する手法を提案した。単純な手法であるにも関わらず,最高性能の検出力を達成した。研究成果は言語処理学会と国際会議EMNLP2023で発表した;(3)同じく対象言語が英語になるが,単語の分散表現を用いて英語の動詞派生前置詞の文法化度を定量化することに成功した。文法化の定量化は世界初の試みである。この研究で言語処理学会の優秀賞を受賞した。 この他,数理的手法による言語変異・変化の研究を主題とした国際研究集会Complexity in Language Variation and Change(COMPILA2023)を海外の研究者と共同開催した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
課題②中近世スペイン語古文書の年代推定・地点推定は遅れているが,その他の実施予定の研究課題は順調に進んでいる。また,当初予定していなかった新たな関連研究課題を発掘することができた。
|
今後の研究の推進方策 |
課題①中近世スペイン語文学作品の著者推定:『贋作ドン・キホーテ』の計量文献学的分析を完了させる。 課題②中近世スペイン語古文書の年代推定・地点推定:未着手のデータ整理を進める。 課題③ラテン語からロマンス語への通時変化のモデル化:系列変換モデルによるラテン語からロマンス語への形態的変化の分析を完了させる。
|