研究課題
人間諸集団が担う広義の文化、特に言語が歴史的にどのように変化してきたか (文化進化) を解明するための統計的モデルの開発に取り組んでいる。文化進化のモデルには、(1) 分岐の繰り返しをともなう縦の継承と (2) 接触による横の伝播の大きく2つが知られている。遺伝学や考古学等は必ずしもそうではないが、歴史言語学はこの2種類の継承の峻別を好む。歴史言語学において、2種類の継承それぞれを扱うモデルが提案されてから既に百数十年が経つが、それらを統合的に扱うことには依然として成功していない。これを阻む大きな要因はデータを特徴づける不確実性であると考え、確率統計的取り組みによって計算集約的な統計的モデルによってこの問題を解決することを主要な目標として掲げた。ややアドホックではあるものの、ベイズ統計に基づく統合的なモデルとその推論アルゴリズムを完成させた。ただし、モデルを実データに適用した結果から言語学的に意味のある知見を得るという点で難航した。この開発の過程で、データ分析のためのアイデアを具体化することを思いつき、そちらにも取り組んだ。具体的には、横の伝播の影響を大きく受けたデータを縦の継承を扱う系統樹モデルに適用した際に生じる異常を検出して可視化する。この手法は単純でかつ、広範囲な既存研究の再検証を可能にする。シミュレーション実験により有効性を確認したうえで、実際に複数の実データから異常を検知した。
すべて 2024 その他
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 備考 (1件)
Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation
巻: - ページ: -
https://github.com/murawaki/treepca