• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

大規模データに基づいた機械学習による抽出的および非抽出的文書要約手法の開発

研究課題

研究課題/領域番号 26280080
研究機関東京工業大学

研究代表者

高村 大也  東京工業大学, 科学技術創成研究院, 准教授 (80361773)

研究分担者 笹野 遼平  東京工業大学, 科学技術創成研究院, 助教 (70603918)
研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード自然言語処理 / 文書要約
研究実績の概要

大量の要約データ(元文書-要約文書ペア)を利用する技術を開発した。特に要約モデルの学習に適切な学習事例を選択する方法、またドメインアダプテーションの手法により大量のデータで学習した要約モデルを、ターゲットとなるドメインにチューニングする方法を開発した。この手法を用いて、実際に文書要約モデルを学習し、高い精度で要約を生成することに成功した。また、ニューラルネットワークに基づく文要約手法において、出力長を制御する手法を開発した。これにより、入力文の内容を保ちつつ、自然な文を出力できるようになった。この技術のプログラムは、インターネット上で一般公開している。さらに、日本語の文圧縮のための大量のデータを自動的に抽出する手法を開発し、実際にこの手法を用いて大規模データを構築し、文圧縮モデルの学習を行った。また、ウェブページの推薦システムにおいて、ユーザにカスタマイズしたスニペットを生成する手法を開発し、実際にこの手法が生成したスニペットが、ウェブページの要約として有用であることを示した。

現在までの達成度 (段落)

28年度が最終年度であるため、記入しない。

今後の研究の推進方策

28年度が最終年度であるため、記入しない。

次年度使用額が生じた理由

28年度が最終年度であるため、記入しない。

次年度使用額の使用計画

28年度が最終年度であるため、記入しない。

  • 研究成果

    (9件)

すべて 2017 2016 その他

すべて 国際共同研究 (1件) 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (6件) (うち国際学会 4件) 備考 (1件)

  • [国際共同研究] Carnegie Melon University(米国)

    • 国名
      米国
    • 外国機関名
      Carnegie Melon University
  • [雑誌論文] Webページ推薦システムにおけるユーザ指向型スニペット生成2016

    • 著者名/発表者名
      渡邉亮彦, 笹野遼平, 高村大也, 奥村学
    • 雑誌名

      人工知能学会論文誌

      巻: 31 ページ: C-G41_1-12

    • DOI

      http://doi.org/10.1527/tjsai.C-G41

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] Japanese Sentence Compression with a Large Training Dataset2017

    • 著者名/発表者名
      Shun Hasegawa, Yuta Kikuchi, Hiroya Takamura and Manabu Okumura
    • 学会等名
      the 55th Annual Meeting of the Association for Computational Linguistics (ACL2017)
    • 発表場所
      Vancouver, Canada
    • 年月日
      2017-07-30 – 2017-08-04
    • 国際学会
  • [学会発表] 大規模データを用いた日本語文圧縮2017

    • 著者名/発表者名
      長谷川駿, 菊池悠太, 高村大也, 奥村学
    • 学会等名
      言語処理学会年次大会
    • 発表場所
      つくば
    • 年月日
      2017-03-13 – 2017-03-17
  • [学会発表] Controlling Output Length in Neural Encoder-Decoders2016

    • 著者名/発表者名
      Yuta Kikuchi, Graham Neubig, Ryohei Sasano, Hiroya Takamura and Manabu Okumura
    • 学会等名
      the Conference on Empirical Methods in Natural Language Processing (EMNLP 2016)
    • 発表場所
      Austin, Texas, USA
    • 年月日
      2016-11-01 – 2016-11-05
    • 国際学会
  • [学会発表] Learning from Numerous Untailored Summaries2016

    • 著者名/発表者名
      Yuta Kikuchi, Akihiko Watanabe, Ryohei Sasano, Hiroya Takamura and Manabu Okumura
    • 学会等名
      The 14th Pacific Rim International Conferences on Artificial Intelligence (PRICAI 2016)
    • 発表場所
      Phuket, Thailand
    • 年月日
      2016-08-22 – 2016-08-22
    • 国際学会
  • [学会発表] Acquiring Activities of People Engaged in Certain Occupations2016

    • 著者名/発表者名
      Miho Matsunagi, Ryohei Sasano, Hiroya Takamura and Manabu Okumura
    • 学会等名
      The 14th Pacific Rim International Conferences on Artificial Intelligence (PRICAI 2016)
    • 発表場所
      Phuket, Thailand
    • 年月日
      2016-08-22 – 2016-08-22
    • 国際学会
  • [学会発表] Encoder-Decoderモデルにおける出力長制御2016

    • 著者名/発表者名
      菊池悠太, Graham Neubig, 笹野遼平, 高村大也, 奥村学
    • 学会等名
      情報処理学会, 自然言語処理研究会
    • 発表場所
      岡山県立大学
    • 年月日
      2016-07-29 – 2016-07-30
  • [備考] lencon

    • URL

      https://github.com/kiyukuta/lencon

URL: 

公開日: 2018-01-16   更新日: 2022-02-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi