2019 Fiscal Year Research-status Report
Project/Area Number |
18K12361
|
Research Institution | The University of Tokyo |
Principal Investigator |
川崎 義史 東京大学, 大学院総合文化研究科, 講師 (40794756)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | スペイン語史 / 年代推定 / 地点推定 / 分散表現 / 言語変化 / 深層学習 |
Outline of Annual Research Achievements |
・類推による不規則動詞の規則化のモデリングの研究については,様々な系列変換モデルの構造とパラメータ設定の下で,実験を繰り返し行った。不規則動詞の規則化は散発的に確認できたが,規則化が生じやすい条件や環境の特定には至っていない。 ・中近世スペイン語品詞タガー開発については,既存の現代スペイン語タガーにより,中近世スペイン語も90%程度の精度でタギングできることを確認した。性能向上には中近世語の教師データを追加する必要があり,その方法の調査を開始した。現代語タガーを活用した研究成果を,国内学会で発表した。 ・中近世スペイン語古文書の年代推定・地点推定の研究については,単語の分散表現を用いた推定モデルを概ね完成させることができた。推定方法は以下の通りである。まず,単語を時空間に埋め込み,分散表現を獲得する。次に,文書をそこに含まれる単語の平均ベクトルとして表す。最後に,文書ベクトルを離散確率分布に変換し,年代と地点を予測する。この手法の特長は,以下の3点である。1点目は,推定誤差の低さである。年代推定は24年,地点推定は100kmの誤差で推定が可能となった。2点目は,文献学的根拠に基づいて推定結果を提示できる点である。これは,獲得された単語の分散表現が,文献学的にも理解可能な形であることによる。3点目は,推定結果を確率分布として提示することで,結果の解釈が容易になる点である。研究成果は,スペインの国際学会で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
・単語の分散表現を用いた年代推定・地点推定の研究を,概ね完成させることができた。 ・これ以外の研究も,データ整理,モデル構築,実験が順調に進んでいる。
|
Strategy for Future Research Activity |
・不規則動詞の規則化のモデリングの研究は,モデルの開発と実験を更に進める。 ・中近世スペイン語品詞タガーの開発については,人手での教師データ作成に注力する。 ・年代推定・地点推定の研究については,文字レベルの分散表現を用いたモデルの開発を行う。
|
Causes of Carryover |
初年度に物品費から購入予定だったパソコンを自弁したため,年度末の出張がコロナ禍のためキャンセルになったため,書籍の購入が遅れているため,未使用額が発生している。 未使用額は,来年度の出張費,書籍購入費,英文添削費用に充当する予定。
|