2020 Fiscal Year Research-status Report
Learning Timeline Difference for Text Categorization based on Global Features of Word Senses and Category Modification
Project/Area Number |
17K00299
|
Research Institution | University of Yamanashi |
Principal Investigator |
福本 文代 山梨大学, 大学院総合研究部, 教授 (60262648)
|
Project Period (FY) |
2017-04-01 – 2022-03-31
|
Keywords | 語義 / パラフレーズ同定 |
Outline of Annual Research Achievements |
今年度は、本手法の有効性、特に語義の有効性を検証するため、他タスクへの適用を実施した。具体的にはパラフレーズ同定タスクへの適用を行った。語義、構文、文から得られる意味表現を組み合わせることにより、パラフレーズの同定が高精度で判定できることを示した。語義の意味表現の他、構文情報としてGCNs (Graph Convolutional Neural Networks)により得られる依存構造の分散表現、そしてBERTにより得られる文単位の分散表現を統合することにより文を表現し、文同士の類似性を求めることにより入力文対がパラフレーズか否かを判定する手法を開発した。ベンチマークデータセットであるMRPC (Microsoft Research Paraphrase Corpus)とQQPデータセットを用いた実験により、本手法がベースとなる既存研究を上回る精度が得られること、特にBERTにより得られる文単位の分散表現と語義の意味表現の組み合わせが精度に貢献することを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
提案手法の他タスクへの適用とベンチマークデータを用いた検証が実施できたため、おおむね順調である。
|
Strategy for Future Research Activity |
全体のまとめとして、成果の公開、具体的には、論文投稿を実施する予定である。
|
Causes of Carryover |
コロナウィルスにより当初予定していた国際学会への投稿を断念した。今年度に投稿を目指すと同時に、手法の実装、及び評価に使用するサーバーを新たに購入する。
|