2020 Fiscal Year Research-status Report
Project/Area Number |
18K12361
|
Research Institution | The University of Tokyo |
Principal Investigator |
川崎 義史 東京大学, 大学院総合文化研究科, 講師 (40794756)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | スペイン語史 / 年代推定 / 地点推定 / 分散表現 / 言語変化 / 深層学習 / 計量文献学 |
Outline of Annual Research Achievements |
・中近世スペイン語古文書の年代推定・地点推定の研究については,文字レベルの情報を考慮した分散表現を獲得する手法(fastText)を実装した。これにより,文字連続の情報から未知語の分散表現を獲得することが可能になった。しかしながら,推定性能の大きな向上は見られなかった。今後の課題は,古文書から学習したモデルを,文学作品等ジャンルの異なる文献の年代推定・地点推定に応用する手法を開発することである。今年度,研究成果を国際学会で発表予定だったが,コロナ禍により延期となった。 ・中近世スペイン語品詞タガーの性能向上には,事前に入力データを人手で整形することが有効なことを確認した。中近世語の教師データの作成にも着手した。今年度,品詞タガーを利用した計量文献学的研究を国際学会で発表予定だったが,コロナ禍により延期となった。また,現代カタルーニャ語品詞タガーを利用した中世カタルーニャ語文献の計量文献学的研究を行い,国内学会で発表した。タギングの精度向上のために,海外の研究者からデータを入手し,データ整理を行なった。 ・類推による古典ラテン語の動詞活用の平準化のモデリングの研究については,動詞の出現頻度と活用形の強勢位置も考慮した系列変換モデルを作成し,様々なパラメータ設定の下で実験を行なった。その結果,平準化や俗ラテン語形の発生が散発的に確認されたが,これらの現象が生じやすい条件や環境の特定には至っていない。研究成果を国内学会で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
・年代推定・地点推定のモデルを改善させることができた。 ・一手間加えることで,中近世スペイン語文献にも現代スペイン語品詞タガーを利用できることが確認できた。 ・動詞活用の平準化のモデリングの研究も,データ整理,モデル構築,実験が順調に進んでいる。
|
Strategy for Future Research Activity |
・年代推定・地点推定の研究については,古文書から学習したモデルが文学作品等ジャンルの異なる文献にも応用できるか調査する。 ・中近世スペイン語文献に対する現代スペイン語品詞タガーの性能向上のために,人手での教師データ作成に注力する。 ・動詞活用の平準化のモデリングの研究については,モデルの開発,実験,考察を更に進める。
|
Causes of Carryover |
初年度に物品費から購入予定だったパソコンを自費購入したため,また,予定していた海外出張がコロナ禍によりキャンセルになったため,未使用額が発生している。 未使用額は,来年度の出張費,書籍購入費,英文添削費用に充当する予定。
|
Research Products
(2 results)