2017 Fiscal Year Annual Research Report
Text Summarization Based on the Combination of Neural Models and Optimization Technologies
Project/Area Number |
17H01786
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
奥村 学 東京工業大学, 科学技術創成研究院, 教授 (60214079)
|
Co-Investigator(Kenkyū-buntansha) |
平尾 努 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (40396148)
高村 大也 東京工業大学, 科学技術創成研究院, 教授 (80361773)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 自然言語処理 |
Outline of Annual Research Achievements |
3つの観点からの文章としての質の自動評価手法の研究開発…テキストの自動評価尺度の研究開発は,良いテキスト(たとえば,文法的な文)のモデルを大量のデータから教師なしで学習し獲得する方法と,良いテキストかどうかを識別する分類器を教師有り学習を用いて学習する方法に大別できる.平成29年度において,要約文の自動評価への受容可能性尺度の適用可能性を吟味した上で,その問題点を検討し,要約文の自動評価に適した形に受容可能性尺度を改良した. テキストの誤解しやすさに関しては,要約は,一般にテキストであり複数の文から構成される.テキスト要約手法には一般に,研究目的欄で述べたように,文選択,文要約,文融合の3つの手法が主に用いられている.そのため,要約作成時において誤解を招くようなテキストを作成してしまう可能性としては,文選択で,選択した複数の文により要約テキストを構成する段階と,文要約あるいは文融合で,要約文を構成する段階が考えられる ことになる.それぞれの段階において得られる要約テキストがどのような場合に誤解を招くものとなり,どのような場合にそうならないかを明らかにするため,一定量の要約テキストに対して,誤解を招くテキストかどうかのラベルを付与したデータを作成した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
3つの観点からの文章としての質の自動評価手法の研究開発に関して予定通り開発が行えたので,今年度については計画通り達成できたと考えている.
|
Strategy for Future Research Activity |
今後も計画通り進めていく予定である.
|
-
-
-
-
-
-
[Presentation] Supervised Attention for Sequence-to-sequence Constituency Parsing2017
Author(s)
Hidetaka, K., Hayashi, K., Hirao, T., Takamura, H., Okumura, M. and Nagata, M.
Organizer
the 8th International Joint Conference on Natural Language Processing (IJCNLP)
Int'l Joint Research
-
-
-