Natural Language Processing Technologies for Formulaic Expressions
Project/Area Number |
18H03297
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | National Institute of Informatics |
Principal Investigator |
Aizawa Akiko 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Project Status |
Completed (Fiscal Year 2020)
|
Budget Amount *help |
¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000)
Fiscal Year 2020: ¥5,460,000 (Direct Cost: ¥4,200,000、Indirect Cost: ¥1,260,000)
Fiscal Year 2019: ¥5,980,000 (Direct Cost: ¥4,600,000、Indirect Cost: ¥1,380,000)
Fiscal Year 2018: ¥5,720,000 (Direct Cost: ¥4,400,000、Indirect Cost: ¥1,320,000)
|
Keywords | 定型表現 / 執筆支援 / ドメイン・コーパス / 辞書自動構築 / 意味表現 |
Outline of Final Research Achievements |
This research aims to develop natural language processing technologies to construct a formulaic expression database for English writing assistance. Focusing on academic paper writing, we proposed a method for extracting and retrieving formulaic expressions with their communicative functions. We also constructed an annotated corpus of sentences with communicative functions that can be used to training and evaluating. Our research demonstrated the effectiveness of deep learning models in extracting communicative functions and grammatical knowledge in extracting formulaic expressions.
|
Academic Significance and Societal Importance of the Research Achievements |
英語による文書作成を支援するための定型表現集が数多く出版されているが、その大半は電子化されておらず、電子化されていたとしても執筆途中に必ずしも気軽に利用できるものではない。本研究では、体系化された定型表現を大規模なドメイン・コーパスに対応付けることによって、ドメインに特化した言い回しや伝達機能などを含む豊富な文脈情報が獲得できることを示した。本研究で得られた知見は、これまで困難であった定型表現の予測や検索の実現に結び付くものである。
|
Report
(4 results)
Research Products
(12 results)