テキスト間の関係を考慮した複数テキスト生成型ニューラル要約に関する研究

研究課題

研究課題/領域番号	21H03495
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	東京工業大学
研究代表者	奥村学東京工業大学, 科学技術創成研究院, 教授 (60214079)
研究分担者	上垣外英剛奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円) 2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円) 2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2021年度: 7,540千円 (直接経費: 5,800千円、間接経費: 1,740千円)
キーワード	自然言語処理 / 複数テキスト要約 / ニューラルモデル / 生成型要約 / 文書横断文間関係
研究開始時の研究の概要	本研究課題では，ニューラル要約モデルを2段階の連結モデルとして構成し， 1) 文書横断共参照解析や文書横断構造解析の解析結果を考慮した上で，要約文集合をその順序とともに生成するニューラルモデル，2) 冗長性の度合いや文の順序の首尾一貫性の度合いを元に，順序付き要約文集合をリランキングし，最適な順序付き要約文集合を出力するニューラルモデルを研究開発する．1)の研究開発は，文書横断共参照解析および文書横断構造解析技術の研究開発と，それらの解析結果をencodeして要約文集合を生成するニューラルモデルの研究開発に細分化できるので，結果的に本研究課題は3つのコア技術に分解し研究開発を行なうことになる．
研究成果の概要	文間の関係を解析する文書構造解析器では，大規模言語モデル (LLM) を活用して，プロンプトを介してシフト還元動作を LLM で模倣する手法を提案し，評価実験の結果，提案法は世界最高の解析性能を達成した．テキスト要約の方では，この文書構造解析結果を活用したニューラル文書要約モデルを提案し，要約の性能向上に寄与することを確認した．また，事前学習済み言語モデル(PLM) を追学習する時に，エンコーダに要約長を予測させることで要約タスクに固有の情報を理解させた上で，デコーダには予測した要約長の要約を生成させるモデルを提案し，要約の性能向上に寄与することを確認した．
研究成果の学術的意義や社会的意義	文間の関係を解析する文書構造解析器は，我々のグループが世界最高性能を達成していたが，引き続き研究開発を継続し，新しい手法を提案することで，現在も世界最高性能を維持している．テキスト要約において要約長を予測するというアイデアはこれまでに提唱されておらず，そういう意味で斬新なアイデアに基づいており，しかも，要約長を予測するよう要約モデルを学習することで性能向上に寄与することを示しており，学術的な意義は大きい．

報告書

(4件)

研究成果
(11件)

すべて 2024 2023 2022 2021

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (10件) (うち国際学会 7件)

[雑誌論文] 疑似正解データを活用したニューラル修辞構造解析2022
- 著者名/発表者名
  小林尚輝, 平尾努, 上垣外英剛, 奥村学, 永田昌明
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 3 ページ: 875-900
- DOI
  10.5715/jnlp.29.875
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実績報告書
- 査読あり
[学会発表] Can we obtain significant success in RST discourse parsing by using Large Language Models?2024
- 著者名/発表者名
  Aru Maekawa, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura
- 学会等名
  The 18th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2024)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 大規模言語モデルによるシフト還元修辞構造解析の模倣2024
- 著者名/発表者名
  前川在, 平尾努, 上垣外英剛, 奥村学
- 学会等名
  言語処理学会第30回年次大会(NLP2024)
- 関連する報告書
  2023 実績報告書
[学会発表] Abstractive Document Summarization with Summary-length Prediction2023
- 著者名/発表者名
  Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura
- 学会等名
  The 17th Conference of the European Chapter of the Association for Computational Linguistics（EACL2023）
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] A Simple and Strong Baseline for End-to-End Neural RST-style Discourse Parsing2022
- 著者名/発表者名
  Naoki Kobayashi, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura and Masaaki Nagata
- 学会等名
  The 2022 Conference on Empirical Methods in Natural Language Processing EMNLP 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 逆翻訳を利用したデータ拡張による文間の修辞構造解析の改善2022
- 著者名/発表者名
  前川在, 小林尚輝, 平尾努, 上垣外英剛, 奥村学
- 学会等名
  言語処理学会第29回年次大会(NLP2023)
- 関連する報告書
  2022 実績報告書
[学会発表] 言語モデルと解析戦略の観点からの修辞構造解析器の比較2022
- 著者名/発表者名
  小林尚輝, 平尾努, 上垣外英剛, 奥村学, 永田昌明
- 学会等名
  言語処理学会第28回年次大会(NLP2022)
- 関連する報告書
  2021 実績報告書
[学会発表] Considering Nested Tree Structure in Sentence Extractive Summarization with Pre-trained Transformer2021
- 著者名/発表者名
  Jingun Kwon, Naoki Kobayashi, Hidetaka Kamigaito and Manabu Okumura
- 学会等名
  The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] A Language Model-based Generative Classifier for Sentence-level Discourse Parsing2021
- 著者名/発表者名
  Ying Zhang, Hidetaka Kamigaito and Manabu Okumura
- 学会等名
  The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Abstractive Document Summarization with Word Embedding Reconstruction2021
- 著者名/発表者名
  Jingyi You, Chenlong Hu, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura
- 学会等名
  RANLP 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Improving Neural RST Parsing Model with Silver Agreement Subtrees2021
- 著者名/発表者名
  Naoki Kobayashi, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura and Masaaki Nagata
- 学会等名
  NAACL-HLT 2021
- 関連する報告書
  2021 実績報告書
- 国際学会

テキスト間の関係を考慮した複数テキスト生成型ニューラル要約に関する研究

研究代表者

奥村 学 東京工業大学, 科学技術創成研究院, 教授 (60214079)

17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)

報告書

研究成果

[雑誌論文] 疑似正解データを活用したニューラル修辞構造解析2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[学会発表] Can we obtain significant success in RST discourse parsing by using Large Language Models?2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模言語モデルによるシフト還元修 辞構造解析の模倣2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Abstractive Document Summarization with Summary-length Prediction2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] A Simple and Strong Baseline for End-to-End Neural RST-style Discourse Parsing2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 逆翻訳を利用したデータ拡 張による文間の修辞構造解析の改善2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 言語モデルと解析戦略の 観点からの修辞構造解析器の比較2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Considering Nested Tree Structure in Sentence Extractive Summarization with Pre-trained Transformer2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] A Language Model-based Generative Classifier for Sentence-level Discourse Parsing2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Abstractive Document Summarization with Word Embedding Reconstruction2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Improving Neural RST Parsing Model with Silver Agreement Subtrees2021

著者名/発表者名

学会等名

関連する報告書

奥村学東京工業大学, 科学技術創成研究院, 教授 (60214079)

[学会発表] 大規模言語モデルによるシフト還元修辞構造解析の模倣2024

[学会発表] 逆翻訳を利用したデータ拡張による文間の修辞構造解析の改善2022

[学会発表] 言語モデルと解析戦略の観点からの修辞構造解析器の比較2022