Project/Area Number |
21K12012
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Nagoya University |
Principal Investigator |
Sasano Ryohei 名古屋大学, 情報学研究科, 准教授 (70603918)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
Keywords | 意味フレーム / 文脈化単語埋め込み |
Outline of Research at the Start |
本研究では、文脈を考慮した単語ベクトル表現(文脈化単語埋め込み)が、人が常識として持つ経験的知識をどの程度捉えているかを明らかにすることを目的とし、日本語と英語を対象に、文脈化単語埋め込みを用いた、大規模コーパスからの意味フレームの自動構築に取り組む。さらに、自動構築したフレーム知識を、人手で整備された知識フレームと対応付けることで、人にとって理解しやすく、かつ、単語埋め込み技術と親和性の高いフレーム知識の構築を目指す。
|
Outline of Final Research Achievements |
In this research project, we worked mainly on automatically constructing semantic frame knowledge using contextualized word embeddings. Specifically, we proposed a method that uses masked word embedding and two-stage clustering for the frame induction task, in which verbs are clustered according to the frames they evoke, and a method that performs fine-tuning of the contextualized word embedding model based on deep metric learning followed by clustering of the verbs. The proposed method achieves a higher performance than the existing methods. In frame element knowledge acquisition task, we proposed a method that performs fine-tuning of the contextualized word embedding model based on deep metric learning followed by clustering of agruments of frame evoking words, and achieved a higher performance than the existing methods.
|
Academic Significance and Societal Importance of the Research Achievements |
本研究の成果は、これまで人手で行われてきた意味フレーム資源の開発コストの低減する可能性がある。具体的には、これまで大規模な意味フレーム資源が整備されてこなかった言語を対象に意味フレームを自動構築したり、人手によるフレーム資源の整備の補助に用いることが可能である。また、大規模なコーパスから学習された大規模言語モデルが、人が言語理解の前提として持つ経験的知識をどの程度含んでいるかの分析に貢献する可能性がある。
|