2018 Fiscal Year Annual Research Report
Natural Language Understanding Based on Discourse Structure and Knowledge
Project/Area Number |
18J12366
|
Research Institution | The University of Tokyo |
Principal Investigator |
西田 典起 東京大学, 情報理工学系研究科, 特別研究員(DC2)
|
Project Period (FY) |
2018-04-25 – 2020-03-31
|
Keywords | 談話構造解析 / 文法推定 / 教師なし学習 |
Outline of Annual Research Achievements |
2018年度は、談話構造解析、特に教師なし学習による談話構造解析という問題設定を行った。教師あり学習に基づく既存の談話構造解析器は人手による談話構造アノテーションを必要とするが、そのようなアノテーションを大規模に用意することは現実的に不可能であり、これは既存アプローチの解析精度が低い原因の一つとして考えられる。一方、本課題で問題設定した教師なし談話構造解析は基本的に生のコーパスのみを必要するという点で大きなメリットがある。 まず、教師なし談話構造解析という問題を3つの部分問題に分割することで大局的なロードマップを設計し、2018年度ではそれらの部分問題について取り組んだ。 一つ目の談話関係については、談話の首尾一貫性に関する言語知識が談話関係の認識に有効であるという仮説のもと、特に困難とされる暗黙的談話関係分類の精度を向上させるための談話の首尾一貫性学習手法を提案し、その有効性を示した。また、それに適した負例サンプリングについても比較検討した。その成果は英語論文としてまとめ、査読あり国際会議に採択され、研究発表を行った。二つ目の談話構成素構造については、統語解析における既存の文法推定手法に注目し、それを教師なし談話構成素構造解析のために拡張した手法を提案した。実験の結果、提案手法がベースラインを上回ることと、既存の教師あり解析器と近い精度を達成できることを示した。また、提案手法によって学習できる(できない)談話構成素の傾向についても分析した。以上の結果を英語論文にまとめ、査読あり海外論文誌に投稿し、現在査読中である。3つ目の談話依存構造については、上記の教師なし談話構成素構造解析手法を依存構造の推定のために拡張した。現在は実験中であり、英語論文化のための準備を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
言語的文脈としての談話構造を教師なし学習によって推定するという挑戦的な問題設定を行い、そのロードマップを設計し、その部分問題について一通り取り組めた。来年度は各部分問題において残っている課題の解決に取り組むとともに、ここまでで得られた解析器による談話構造を既存の自然言語理解システムに導入する方法を模索し、談話構造の自然言語理解における有効性を確認する。
|
Strategy for Future Research Activity |
2018年度では教師なし談話構造解析という問題設定を行い、その部分問題に取り組んだ。教師なし談話構成素構造解析、教師なし談話依存構造解析、教師なし談話関係分類というそれぞれの部分問題自体が計算言語学、自然言語処理において挑戦的な課題であり、今後も取り組んでいく価値があると考えている。そのため、2019年度も引き続き各部分問題に向けて取り組んでいく。また、現時点では、推定された談話構造を人がアノテーションした談話構造と比較することによって評価を行っているが、次のステップとしては推定された談話構造を既存の言語理解システムに統合することによって、自然言語理解における談話構造の有効性について評価していく。
|
Research Products
(2 results)