研究課題/領域番号 |
17K12738
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京工業大学 |
研究代表者 |
西川 仁 東京工業大学, 情報理工学院, 助教 (00765026)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2017年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | 自動要約 / 文簡約 / 深層学習 / 単一文書要約 / 自然言語処理 |
研究成果の概要 |
簡約コーパスの構築が完了し,また入手した大規模な新聞記事自動要約データとあわせて要約および簡約を実行するモデルを構築した.具体的には,新聞記事に対し要約及び平易化の両方を行った.その過程を記事全体に対する処理と各文に対する処理に分けてモデルを実装し,それぞれのモデルの学習には,構築した簡約コーパスを用いた.生成された記事に対する定量評価の結果,記事処理及び文処理モデルの両方を適用することで,元記事や一方のモデルのみを適用する場合に比べ生成されたテキストの品質を測定する自動評価尺度であるBLEU,ROUGE,SARIの値が向上し,より正解テキストに近い,短く平易な記事を生成できることが示された.
|
研究成果の学術的意義や社会的意義 |
情報化社会の進展に伴い,自動要約および平易化といった,テキストの読解を支援する技術への需要が高まっている.長いテキストから重要箇所を抽出し短くまとめる「要約」は読み手の迅速な内容把握を可能にし,大量の文献の読解や調査などを必要とする知識労働者の生産性を大幅に向上せしめることが期待される.また,専門用語などの難解な表現に対し削除及び易しい表現への置換を行う「平易化」は外国人や子供など語彙知識が不足している読み手の読解を補助する.これらを組み合わせ読み手に合わせてテキストを柔軟に変化させることによって電子化されたテキストを読解する幅広い層に対して読解支援を行うことが可能となる.
|