研究課題
英語による文書作成を支援するための定型表現集が数多く出版されているが、その大半は電子化されておらず、電子化されていたとしても執筆途中に必ずしも気軽に利用できるものではない。本課題では、英語の非母語話者による論文執筆支援に焦点をあてて、ユーザのあいまいな入力に基づき適切な定型表現を提示する手法の開発に取り組んでいる。具体的には、大量の論文コーパスを計算機で解析して、談話構造などに対応づけられた豊富な文脈情報を獲得することで、定型表現の予測や検索精度の向上に結びつける手法の確立を目指している。本年度は、異なる4つの学術分野を対象として、定型表現機能の正解付きデータセットを構築し、ニューラルネットワークに基づく予測手法で優れた性能が得られることを示した。また、定型表現の抽出手法に関する研究に取り組み、固有表現抽出および依存構造解析を用いた定型表現抽出法を新たに提案して有効性を示した。さらに、これまでの研究成果に基づき、機能的な意味を付与した大規模な定型表現データベースを実際に構築し、機能的な意味に基づく定型表現検索により、従来のキーワード検索では得られない多様な表現が得られることを検証した。
令和2年度が最終年度であるため、記入しない。
すべて 2021 2020
すべて 雑誌論文 (4件) (うち国際共著 1件、 査読あり 4件、 オープンアクセス 4件) 学会発表 (1件)
The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2021): Main Volume..
巻: - ページ: 3476-3497
The AAAI-21 Workshop on Scientific Document Understanding.
巻: - ページ: -
EMNLP 2020 (2020 Conference on Empirical Methods in Natural Language Processing).
巻: - ページ: 750-765
10.18653/v1/2020.findings-emnlp.67
The 12th International Conference on Language Resources and Evaluation (LREC 2020)
巻: - ページ: 1712-1720