• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

Abstractive Neural Multi-document Summarization Considering Cross Document Structure

Research Project

Project/Area Number 21H03495
Research InstitutionTokyo Institute of Technology

Principal Investigator

奥村 学  東京工業大学, 科学技術創成研究院, 教授 (60214079)

Co-Investigator(Kenkyū-buntansha) 上垣外 英剛  奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords自然言語処理 / 複数テキスト要約 / ニューラルモデル / 生成型要約 / 文書横断文間関係
Outline of Annual Research Achievements

テキスト内の文間の関係を解析する文書構造解析器は,我々のグループが世界最高性能を達成していたが,引き続き研究開発を継続し,新しい手法を提案することで,現在も世界最高性能を維持している.
デコーダのみからなる大規模言語モデル (LLM) の発展は目覚ましく,様々な自然言語処理タスクにおいて良好な結果を残している.一方,文書構造解析におけるそれらの有効性はこれまで議論されていない.そこで,今後の文書構造解析の研究において LLM を活用すべきかどうかを探ることを目的として,プロンプトを介してシフト還元動作を LLM で模倣する手法を提案し,その有効性を議論した.評価実験の結果,提案法は世界最高の解析性能を達成し,テキストドメインの汎化性においても優れていた.つまり,修辞構造解析においても LLM に注力すべきことが強調される結果を得た.
テキスト要約の方では,事前学習済み言語モデル (PLM) を追学習することで実用的な生成型要約モデルを獲得できることが明らかになっているが,目標の要約長など要約タスクに固有の情報を PLM の事前学習時に十分考慮できているとは言えない.そこで追学習時に,エンコーダに要約長を予測させることで要約タスクに固有の情報を理解させた上で,デコーダには予測した要約長の要約を生成させるモデルを提案した.
WikiHow, NYT, CNN/DMデータセットを用いた実験により,BARTよりもROUGEスコアを向上させること,WikiHowデータセットでは,GSumよりもROUGE-1, -2, -Lをそれぞれ約3.0, 1,5, 3.1ポイント向上させることを確認した.

Research Progress Status

令和5年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和5年度が最終年度であるため、記入しない。

  • Research Products

    (3 results)

All 2024 2023

All Presentation (3 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] Can we obtain significant success in RST discourse parsing by using Large Language Models?2024

    • Author(s)
      Aru Maekawa, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura
    • Organizer
      The 18th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2024)
    • Int'l Joint Research
  • [Presentation] 大規模言語モデルによるシフト還元修 辞構造解析の模倣2024

    • Author(s)
      前川在, 平尾努, 上垣外英剛, 奥村学
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] Abstractive Document Summarization with Summary-length Prediction2023

    • Author(s)
      Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura
    • Organizer
      The 17th Conference of the European Chapter of the Association for Computational Linguistics(EACL2023)
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi