2017 Fiscal Year Research-status Report
Project/Area Number |
17K12738
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
西川 仁 東京工業大学, 情報理工学院, 助教 (00765026)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 自動要約 / 単一文書要約 / 文簡約 |
Outline of Annual Research Achievements |
初年度にあたる当年度は,テキスト個人化実験コーパスの構築(研究項目1-a)および要約手法の開発と評価(研究項目1-b)を研究項目として挙げていたが,大規模な要約コーパスを別途入手できたため,要約手法の開発と評価(研究項目1-b)に焦点をあて,集中して検討した.要約手法として,深層学習を利用した自動要約の枠組みを利用した要約器を開発したが,当該コーパスに含まれる文書と対応する要約の対においては,広く要約研究に用いられているコーパスに比べ厳しい要約率(より短い要約を生成する必要がある)を求められるため,適切な要約を生成することが難しく,現時点では満足する結果が得られていない.得られた知見としては,端的な要約を生成するためには入力文書と対応する要約の対だけなく,表現の抽象化に寄与する,外部の別種の言語資源を合わせて利用する必要があるという点である.
並行して,要約手法を評価するための実験システムを構築した.当該実験システムは,入力文書と,要約器が出力した要約との対応関係を視覚的に表示できるため,評価者が直感的に要約品質を評価することが可能である.また,要約器が出力した要約に対して評価者が編集操作を加え,それを要約器に対してフィードバックすることが可能である.この実験システムを利用することで,要約器が出力する要約の品質を迅速かつ正確に評価することが可能となる.
加えて,研究課題推進の基盤整備のため,計算用サーバを1台調達した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究項目1-b「要約手法の開発と評価」について満足な結果をまだ得ることができていない.当該項目は本研究課題の核となる項目であるため,引き続き当該項目の検討を推進する.
|
Strategy for Future Research Activity |
引き続き要約手法の開発を継続する.開発を加速するため,外部の研究者との議論,連携を推進する.
|
Causes of Carryover |
計算用サーバを2台調達する予定であったが,仕様の検討に時間を要したため1台のみの調達に留まった.次年度に計算用サーバをもう1台調達する.
|