• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

ニューラルモデルと離散最適化技術を用いた高品質な要約作成

研究課題

研究課題/領域番号 17H01786
研究機関東京工業大学

研究代表者

奥村 学  東京工業大学, 科学技術創成研究院, 教授 (60214079)

研究分担者 平尾 努  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (40396148)
高村 大也  東京工業大学, 科学技術創成研究院, 教授 (80361773)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード自然言語処理
研究実績の概要

我々が世界に先駆けて開発した,ニューラルモデルの1つであるencoder-decoderモデルによる非抽出型の文要約において出力文の長さを制御する手法[1]を受け,出力長を考慮した文要約モデルを評価するためのコーパス JApanese MUlti-Length Headline Corpus (JAMUL)を提案,開発した.

[1] Yuta Kikuchi, Graham Neubig, Ryohei Sasano, Hiroya Takamura and Manabu Okumura, Controlling Output Length in Neural Encoder-Decoders, to appear in EMNLP 2016, 2016.

次に,原文書の談話構造を考慮する新たな抽出型ニューラル要約モデルを提案した.修辞構造理論に代表される談話構造を表現する枠組みは,文書中の文や単語などの間に内在する意味的なつながりに着目する.リカレントニューラルネットワーク (RNN)に基づく抽出型手法が 2016 年以降,単一文書要約において良い性能を示している.この手法は原文書を文の系列とみなしベクトル化し文の重要度を決定し,文間の談話構造は明示的には利用しない.談話構造に関する情報の欠如は,重要度スコア決定における性能劣化や出力要約の一貫性の低下を引き起こす可能性がある.そこで,談話構造解析器の解析誤りによる影響を抑えながら,RNN を用いた要約モデルの性能における利点を活用するため,原文書の談話構造と文の重要度スコアリング器を同時に学習する新たな枠組みを提案した.DailyMail データセットを用いた評価実験において,提案手法がベースラインよりも ROUGE 値および人手評価において良い評価値を得た.さらに,既存の性能の良い手法と同等もしくは,より良い結果を得た.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

原文書の談話構造を考慮する新たな抽出型ニューラル要約モデルを提案し,評価実験において,現時点で最高性能の結果を得られたので,今年度については計画通り達成できたと考えている.

今後の研究の推進方策

今後も計画通り進めていく予定である.

  • 研究成果

    (7件)

すべて 2019 2018

すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (1件) 産業財産権 (2件)

  • [雑誌論文] テキストセグメンテーションによる教師なし修辞構造 解析2019

    • 著者名/発表者名
      小林尚輝, 平尾努, 中村健吾, 上垣外英剛, 奥村学, 永田昌明
    • 雑誌名

      言語処理学会第25回年次大会発表論文集

      巻: - ページ: 998-1001

    • 査読あり
  • [雑誌論文] 階層構造を考慮したトップダウン談話構造解析2019

    • 著者名/発表者名
      小林尚輝, 平尾努, 上垣外英剛, 奥村学, 永田昌明
    • 雑誌名

      言語処理学会第25回年次大会発表論文集

      巻: - ページ: 1002-1005

    • 査読あり
  • [雑誌論文] 出力長制御を考慮した見出し生成モデルのための大規模コーパス2019

    • 著者名/発表者名
      人見雄太, 田口雄哉, 田森秀明, 菊田洸, 西鳥羽二郎, 岡崎直観, 乾健太郎, 奥村学
    • 雑誌名

      言語処理学会第25回年次大会発表論文集

      巻: - ページ: 6-11

    • 査読あり
  • [雑誌論文] Automatic Pyramid Evaluation Exploiting EDU-based Extractive Reference Summaries2018

    • 著者名/発表者名
      Hirao, T., Kamigaito, H. and Nagata, M.
    • 雑誌名

      Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing

      巻: - ページ: 4177-4186

    • 査読あり
  • [学会発表] 談話構造を考慮する階層的注意機構による抽出型ニューラル単一文書要約2019

    • 著者名/発表者名
      石垣達也, 上垣外英剛, 高村大也, 奥村学
    • 学会等名
      言語処理学会第25回年次大会
  • [産業財産権] 談話構造解析装置2019

    • 発明者名
      平尾努,永田昌明,小林尚輝,奥村学
    • 権利者名
      平尾努,永田昌明,小林尚輝,奥村学
    • 産業財産権種類
      特許
    • 産業財産権番号
      特願2019-028629
  • [産業財産権] 木構造解析装置2019

    • 発明者名
      平尾努,永田昌明,小林尚輝,奥村学
    • 権利者名
      平尾努,永田昌明,小林尚輝,奥村学
    • 産業財産権種類
      特許
    • 産業財産権番号
      特願2019-035758

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi