• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Abstractive Neural Multi-document Summarization Considering Cross Document Structure

Research Project

Project/Area Number 21H03495
Research InstitutionTokyo Institute of Technology

Principal Investigator

奥村 学  東京工業大学, 科学技術創成研究院, 教授 (60214079)

Co-Investigator(Kenkyū-buntansha) 上垣外 英剛  東京工業大学, 科学技術創成研究院, 助教 (40817649)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords自然言語処理
Outline of Annual Research Achievements

テキスト内の文間の関係を解析する文書構造解析器は,我々のグループが世界最高性能を達成していたが,引き続き研究開発を継続し,新しい手法を提案することで,現在も世界最高性能を維持している.

ニューラル機械翻訳で提案された逆翻訳による疑似正解データの活用にヒントを得て,既存の修辞構造解析器を用いて自動的に作成された大規模な疑似正解データを用いて解析器を事前学習し,本来の訓練データを用いて追学習することで性能を改善する枠組みを提案した.また,疑似正解データを大量かつ高品質に獲得するために,複数の解析器が出力する木の間
で重複する部分木を疑似正解データとして効率よく抽出するアルゴリズムを提案した.

また,このテキスト内での文書構造解析結果を活用したニューラル文書要約モデルを提案し,要約の性能向上に寄与することを確認した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

テキスト内の文間の関係を解析する文書構造解析器は,我々のグループが世界最高性能を達成していたが,引き続き研究開発を継続し,新しい手法を提案することで,現在も世界最高性能を維持している.

ニューラル機械翻訳で提案された逆翻訳による疑似正解データの活用にヒントを得て,既存の修辞構造解析器を用いて自動的に作成された大規模な疑似正解データを用いて解析器を事前学習し,本来の訓練データを用いて追学習することで性能を改善する枠組みを提案した.また,疑似正解データを大量かつ高品質に獲得するために,複数の解析器が出力する木の間
で重複する部分木を疑似正解データとして効率よく抽出するアルゴリズムを提案した.

また,このテキスト内での文書構造解析結果を活用したニューラル文書要約モデルを提案し,要約の性能向上に寄与することを確認した.

Strategy for Future Research Activity

単一文書内での構造解析,ニューラル要約モデルを文書横断構造解析,ニューラル複数文書要約モデルへと拡張していくことを引き続き進めていく予定である.

  • Research Products

    (5 results)

All 2022 2021

All Presentation (5 results) (of which Int'l Joint Research: 4 results)

  • [Presentation] 言語モデルと解析戦略の 観点からの修辞構造解析器の比較2022

    • Author(s)
      小林尚輝, 平尾努, 上垣外英剛, 奥村学, 永田昌明
    • Organizer
      言語処理学会第28回年次大会(NLP2022)
  • [Presentation] Considering Nested Tree Structure in Sentence Extractive Summarization with Pre-trained Transformer2021

    • Author(s)
      Jingun Kwon, Naoki Kobayashi, Hidetaka Kamigaito and Manabu Okumura
    • Organizer
      The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021)
    • Int'l Joint Research
  • [Presentation] A Language Model-based Generative Classifier for Sentence-level Discourse Parsing2021

    • Author(s)
      Ying Zhang, Hidetaka Kamigaito and Manabu Okumura
    • Organizer
      The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021)
    • Int'l Joint Research
  • [Presentation] Abstractive Document Summarization with Word Embedding Reconstruction2021

    • Author(s)
      Jingyi You, Chenlong Hu, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura
    • Organizer
      RANLP 2021
    • Int'l Joint Research
  • [Presentation] Improving Neural RST Parsing Model with Silver Agreement Subtrees2021

    • Author(s)
      Naoki Kobayashi, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura and Masaaki Nagata
    • Organizer
      NAACL-HLT 2021
    • Int'l Joint Research

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi