2015 Fiscal Year Research-status Report
Project/Area Number |
26730122
|
Research Institution | Kyoto University |
Principal Investigator |
村脇 有吾 京都大学, 情報学研究科, 助教 (70616606)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 言語系統論 / 言語類型論 / ベイズ統計 / 分散表現 |
Outline of Annual Research Achievements |
本研究では、統計的手法による言語の歴史的変化と言語間の系統関係の推定を目的としており、特に従来の統計的手法が適用できない日本語の問題の解決を試みている。系統推定に必要なデータはすぐに利用可能な形で整備されているわけではない。2年目となる本年度は、昨年度に引き続き、既存の紙ベースの方言調査報告を土台に、機械可読なデータベースの作りつつ、その統計的モデル化に取り組んでいる。これと並行して進めてきた、従来研究が主に用いてきた同源語 (cognate、語源を同じくする語) に基づく取り組みや言語類型 (語順や声調の有無などの特徴) を用いる取り組みの研究が、予想外に大きな成果を出しつつある。昨年度から進めてきた、接触による語彙伝播の空間構造モデルは一応の完成を見たが、この研究の過程で、系統樹が潜在空間上で特異な振る舞いをすることを発見しており、これが新たなモデル化につながる可能性があるため引き続き検討してく。言語類型についても、従来手法は特徴の変化を表層的にモデル化していたが、潜在表現を考えるという新しい方向性を提起した。本年度は、各言語を潜在空間上で表現することにより、言語の共時的な性質を捉えられることを示した。すなわち、言語は一個のシステムであり、言語として自然な類型論の特徴の組み合わせを持たなければならない。実在する言語群は自然であり、その他の特徴の組み合わせは暗黙的に不自然であるという仮定のもと、これを実現する潜在空間表現を求める手法を開発した。この手法は共時的性質を捉えたものであり、言語系統という通時的課題への本格的な応用はこれからの課題である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
アクセントを手がかりとした統計的推定モデルの開発という当初の計画は難航しており、この点において、「やや遅れている」という区分があてはまるかと思われる。一方、当初の計画ではほとんど考慮していなかった、同源語に基づく取り組みと言語類型に基づく取り組みが予想外に大きな成果を上げつつあり、今後はこちらに研究の比重を移すことも検討している。
|
Strategy for Future Research Activity |
アクセントを手がかりとした統計的推定モデルの開発には引き続き取り組むが、同時に、当初の計画にはなかった、同源語に基づく取り組みと言語類型に基づく取り組みを重点的に進める。具体的なサブ課題は「研究実績の概要」に挙げた通りである。
|
Causes of Carryover |
申請者本人が年度後半 (1月) に異動したため、執行に遅れが生じた。
|
Expenditure Plan for Carryover Budget |
納品までに長時間を要し、かつ所要時間が不確実であったため昨年度の購入を断念した稀覯本のほか、国際会議出張への支出を予定している。
|
Research Products
(6 results)
-
-
[Presentation] Statistical Modeling of Creole Genesis2016
Author(s)
Yugo Murawaki
Organizer
2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies
Place of Presentation
San Diego, California, US
Year and Date
2016-06-13 – 2016-06-15
Int'l Joint Research
-
-
-
-