• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

テキスト間の関係を考慮した複数テキスト生成型ニューラル要約に関する研究

研究課題

研究課題/領域番号 21H03495
研究機関東京工業大学

研究代表者

奥村 学  東京工業大学, 科学技術創成研究院, 教授 (60214079)

研究分担者 上垣外 英剛  東京工業大学, 科学技術創成研究院, 助教 (40817649)
研究期間 (年度) 2021-04-01 – 2024-03-31
キーワード自然言語処理
研究実績の概要

テキスト内の文間の関係を解析する文書構造解析器は,我々のグループが世界最高性能を達成していたが,引き続き研究開発を継続し,新しい手法を提案することで,現在も世界最高性能を維持している.

ニューラル機械翻訳で提案された逆翻訳による疑似正解データの活用にヒントを得て,既存の修辞構造解析器を用いて自動的に作成された大規模な疑似正解データを用いて解析器を事前学習し,本来の訓練データを用いて追学習することで性能を改善する枠組みを提案した.また,疑似正解データを大量かつ高品質に獲得するために,複数の解析器が出力する木の間
で重複する部分木を疑似正解データとして効率よく抽出するアルゴリズムを提案した.

また,このテキスト内での文書構造解析結果を活用したニューラル文書要約モデルを提案し,要約の性能向上に寄与することを確認した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

テキスト内の文間の関係を解析する文書構造解析器は,我々のグループが世界最高性能を達成していたが,引き続き研究開発を継続し,新しい手法を提案することで,現在も世界最高性能を維持している.

ニューラル機械翻訳で提案された逆翻訳による疑似正解データの活用にヒントを得て,既存の修辞構造解析器を用いて自動的に作成された大規模な疑似正解データを用いて解析器を事前学習し,本来の訓練データを用いて追学習することで性能を改善する枠組みを提案した.また,疑似正解データを大量かつ高品質に獲得するために,複数の解析器が出力する木の間
で重複する部分木を疑似正解データとして効率よく抽出するアルゴリズムを提案した.

また,このテキスト内での文書構造解析結果を活用したニューラル文書要約モデルを提案し,要約の性能向上に寄与することを確認した.

今後の研究の推進方策

単一文書内での構造解析,ニューラル要約モデルを文書横断構造解析,ニューラル複数文書要約モデルへと拡張していくことを引き続き進めていく予定である.

  • 研究成果

    (5件)

すべて 2022 2021

すべて 学会発表 (5件) (うち国際学会 4件)

  • [学会発表] 言語モデルと解析戦略の 観点からの修辞構造解析器の比較2022

    • 著者名/発表者名
      小林尚輝, 平尾努, 上垣外英剛, 奥村学, 永田昌明
    • 学会等名
      言語処理学会第28回年次大会(NLP2022)
  • [学会発表] Considering Nested Tree Structure in Sentence Extractive Summarization with Pre-trained Transformer2021

    • 著者名/発表者名
      Jingun Kwon, Naoki Kobayashi, Hidetaka Kamigaito and Manabu Okumura
    • 学会等名
      The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021)
    • 国際学会
  • [学会発表] A Language Model-based Generative Classifier for Sentence-level Discourse Parsing2021

    • 著者名/発表者名
      Ying Zhang, Hidetaka Kamigaito and Manabu Okumura
    • 学会等名
      The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021)
    • 国際学会
  • [学会発表] Abstractive Document Summarization with Word Embedding Reconstruction2021

    • 著者名/発表者名
      Jingyi You, Chenlong Hu, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura
    • 学会等名
      RANLP 2021
    • 国際学会
  • [学会発表] Improving Neural RST Parsing Model with Silver Agreement Subtrees2021

    • 著者名/発表者名
      Naoki Kobayashi, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura and Masaaki Nagata
    • 学会等名
      NAACL-HLT 2021
    • 国際学会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi