• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

要約技術と簡約技術を融合したテキストの個人化

研究課題

研究課題/領域番号 17K12738
研究種目

若手研究(B)

配分区分基金
研究分野 知能情報学
研究機関東京工業大学

研究代表者

西川 仁  東京工業大学, 情報理工学院, 助教 (00765026)

研究期間 (年度) 2017-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2017年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワード自動要約 / 文簡約 / 深層学習 / 単一文書要約 / 自然言語処理
研究成果の概要

簡約コーパスの構築が完了し,また入手した大規模な新聞記事自動要約データとあわせて要約および簡約を実行するモデルを構築した.具体的には,新聞記事に対し要約及び平易化の両方を行った.その過程を記事全体に対する処理と各文に対する処理に分けてモデルを実装し,それぞれのモデルの学習には,構築した簡約コーパスを用いた.生成された記事に対する定量評価の結果,記事処理及び文処理モデルの両方を適用することで,元記事や一方のモデルのみを適用する場合に比べ生成されたテキストの品質を測定する自動評価尺度であるBLEU,ROUGE,SARIの値が向上し,より正解テキストに近い,短く平易な記事を生成できることが示された.

研究成果の学術的意義や社会的意義

情報化社会の進展に伴い,自動要約および平易化といった,テキストの読解を支援する技術への需要が高まっている.長いテキストから重要箇所を抽出し短くまとめる「要約」は読み手の迅速な内容把握を可能にし,大量の文献の読解や調査などを必要とする知識労働者の生産性を大幅に向上せしめることが期待される.また,専門用語などの難解な表現に対し削除及び易しい表現への置換を行う「平易化」は外国人や子供など語彙知識が不足している読み手の読解を補助する.これらを組み合わせ読み手に合わせてテキストを柔軟に変化させることによって電子化されたテキストを読解する幅広い層に対して読解支援を行うことが可能となる.

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (5件)

すべて 2020 2019 2018

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (3件) (うち国際学会 2件)

  • [雑誌論文] 大規模格フレームによる解候補削減を用いたニューラルネットゼロ照応解析2019

    • 著者名/発表者名
      山城颯太, 西川仁, 徳永健伸
    • 雑誌名

      自然言語処理

      巻: 印刷中

    • NAID

      130007706819

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] 外界一人称と二人称を考慮する日本語述語項構造解析の分野適応2019

    • 著者名/発表者名
      珊瑚彩主紀, 西川仁, 徳永健伸
    • 雑誌名

      自然言語処理

      巻: 印刷中

    • NAID

      130007706817

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [学会発表] ニューステキストの要約及び平易化2020

    • 著者名/発表者名
      菅井内音,西川仁,徳永健伸
    • 学会等名
      言語処理学会第26回年次大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Effectiveness of Domain Adaptation in Japanese Predicate-Argument Structure Analysis2018

    • 著者名/発表者名
      Mizuki Sango, Hitoshi Nishikawa, and Takenobu Tokunaga
    • 学会等名
      The 32nd Pacific Asia Conference on Language, Information and Computation
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Neural Japanese Zero Anaphora Resolution using Smoothed Large-scale Case Frames with Word Embedding2018

    • 著者名/発表者名
      Souta Yamashiro, Hitoshi Nishikawa, and Takenobu Tokunaga
    • 学会等名
      The 32nd Pacific Asia Conference on Language, Information and Computation
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会

URL: 

公開日: 2017-04-28   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi