2016 Fiscal Year Annual Research Report
Development of methods for extractive and abstractive text summarization based on machine learning with large-scale data
Project/Area Number |
26280080
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
高村 大也 東京工業大学, 科学技術創成研究院, 准教授 (80361773)
|
Co-Investigator(Kenkyū-buntansha) |
笹野 遼平 東京工業大学, 科学技術創成研究院, 助教 (70603918)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 自然言語処理 / 文書要約 |
Outline of Annual Research Achievements |
大量の要約データ(元文書-要約文書ペア)を利用する技術を開発した。特に要約モデルの学習に適切な学習事例を選択する方法、またドメインアダプテーションの手法により大量のデータで学習した要約モデルを、ターゲットとなるドメインにチューニングする方法を開発した。この手法を用いて、実際に文書要約モデルを学習し、高い精度で要約を生成することに成功した。また、ニューラルネットワークに基づく文要約手法において、出力長を制御する手法を開発した。これにより、入力文の内容を保ちつつ、自然な文を出力できるようになった。この技術のプログラムは、インターネット上で一般公開している。さらに、日本語の文圧縮のための大量のデータを自動的に抽出する手法を開発し、実際にこの手法を用いて大規模データを構築し、文圧縮モデルの学習を行った。また、ウェブページの推薦システムにおいて、ユーザにカスタマイズしたスニペットを生成する手法を開発し、実際にこの手法が生成したスニペットが、ウェブページの要約として有用であることを示した。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Causes of Carryover |
28年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
28年度が最終年度であるため、記入しない。
|
Research Products
(9 results)
-
-
-
-
-
-
[Presentation] Learning from Numerous Untailored Summaries2016
Author(s)
Yuta Kikuchi, Akihiko Watanabe, Ryohei Sasano, Hiroya Takamura and Manabu Okumura
Organizer
The 14th Pacific Rim International Conferences on Artificial Intelligence (PRICAI 2016)
Place of Presentation
Phuket, Thailand
Year and Date
2016-08-22 – 2016-08-22
Int'l Joint Research
-
-
-