2018 Fiscal Year Annual Research Report
Interactive Summarization System to Support Literature Survey
Project/Area Number |
16K12546
|
Research Institution | National Institute of Informatics |
Principal Investigator |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
Co-Investigator(Kenkyū-buntansha) |
徳永 健伸 東京工業大学, 情報理工学院, 教授 (20197875)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 情報組織化 / レビューマトリックス / 文書要約 / 質問応答システム / 文検索 |
Outline of Annual Research Achievements |
学術文献の俯瞰は研究者や技術者にとって、時間を要する困難な作業である。対象となる文献が大量にある上に、多くの場合、必要な情報は抄録には書かれておらず、論文全体を通読して捜す必要がある。ここで近年、レビュー・マトリクスと呼ばれる一覧表形式を用いて、文献ごとにポイントをまとめる情報整理法が注目されている。これは読み手自身が、目的に応じたテンプレートを使って、文書ごとの要約を作成することに相当する。本研究は、大量文書の俯瞰的な理解を支援するためレビューマトリックス作成支援に焦点をあてて、その要素技術として、複数論文を自動要約するための手法について検討を行った。具体的には、レビューマトリックスの生成を「クエリ付き複数文書要約」として定式化した上で、要約どうしの文書をまたがる対応関係を制約として考慮する要約手法を検討した。また、自然言語処理分野において一般的な「共通タスク(shared task)のワークショップ」に注目し、タスクオーガナイザーの概要論文に掲載された参加システム一覧表をレビューマトリックスの正解データ、タスク参加者による投稿論文を要約対象文書とするデータセットを構築した。H30年度では、タスク後に発表された未知の論文に対しても評価が行えるようデータセットを拡張するとともに、文の埋め込み表現の計算にキーワードグラフによる重みづけを導入する手法を提案して有効性を示し、その成果を国際ワークショップ(BIRNDL-2018)で発表した。
|
Research Products
(1 results)