2019 Fiscal Year Annual Research Report
Automatic Financial News Summary Using GPU based Deep Neural Networks
Project/Area Number |
19F19800
|
Research Institution | Waseda University |
Principal Investigator |
古月 敬之 早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (50294905)
|
Co-Investigator(Kenkyū-buntansha) |
LUO JIA 早稲田大学, 理工学術院, 外国人特別研究員
|
Project Period (FY) |
2019-11-08 – 2022-03-31
|
Keywords | 深層学習 / 並列計算 / テキスト解析 / 関連解析 / サマリー生成 |
Outline of Annual Research Achievements |
本研究では、ディープラーニング技術に基づいた高度な関係性を抽出することができる高性能な合成関係ネットワークの構築と、GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行い、さらにこれらの技術をベースにしてテキスト文書の特徴抽出・関係分析の手法の開発を行う。これにより金融等のニュースを解析し、Bullet Pointsに基づいた金融等のニュース自動サマリーシステムを構築することを目標する。 この研究目標を実現するために、二つのテーマを分けて行う。テーマ①高度な関係性を抽出するための高性能な合成関係ネットワークを構築するディープラーニング技術、テーマ②GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行う。これを通して、金融等のニュース自動サマリーシステムを高性能化する。 本年では、主として金融等の関連データベースの構築、および既存の深層学習フレームワークを利用しCNN、LSTM、GAN深層学習技術による金融等のニュース自動サマリーシステムの基本構成を行った。例えば、Word Embeddingモデル(Word2vec)、Attention技術を用いたDNNであるLSTM, CNNによるテキスト文書の特徴抽出技術、キーワードで多層パーセプトロン関係ネットワークによるトッピング検出し関連ニュースの文書抽出技術、GANという生成ネットワークによる金融等のニュースのBullet Pointsサマリーの自動生成技術の開発を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
計画通り、CNN、LSTM、GAN深層学習技術による金融等のニュース自動サマリーシステムの基本構成を行った。 1) Word Embeddingモデル(Word2vec)、Attention技術を用いたDNNであるLSTM, CNNによるテキスト文書の特徴抽出技術、 2) キーワードで多層パーセプトロン関係ネットワークによるトッピング検出し関連ニュースの文書抽出技術、 3) GANという生成ネットワークによる融ニュースのBullet Pointsサマリーの自動生成技術の開発を行った。
|
Strategy for Future Research Activity |
次年度では、構成した金融ニュース自動サマリーシステムの完成度向上と性能向上や拡張を図る。具体的に、 1)より柔軟な高性能合成関係ネットワークの構築を目指して、従来のR(a,b)表現ではなく、aRb表現で類似関係モジュールと高度関係モジュールからなる合成関係ネットワークを構築し高度な関係情報の抽出を行う。 2)GPUを用いたCNN、LSTM、GANの高度な並列計算技術の開発を目指して、最先端な並列計算技術を用いてCNN、LSTM、GAN効率的な並列計算アルゴリズムの開発を行う。
|