研究実績の概要 |
本研究では、ディープラーニング技術に基づいた高度な関係性を抽出することができる高性能な合成関係ネットワークの構築と、GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行い、さらにこれらの技術をベースにしてテキスト文書の特徴抽出・関係分析の手法の開発を行う。これにより金融等のニュースを解析し、Bullet Pointsに基づいた金融等のニュース自動サマリーシステムを構築することを目標する。 この研究目標を実現するために、二つのテーマを分けて行う。テーマ①高度な関係性を抽出するための高性能な合成関係ネットワークを構築するディープラーニング技術、テーマ②GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行う。これを通して、金融等のニュース自動サマリーシステムを高性能化する。 本年では、前年度の引き続き金融等のニュース自動サマリーシステムの構築と性能向上を行った。例えば、注意力機構を適用した注意力関係ネットワークの構築やローカルコーパスを用いた言語モデルBERTとBARTのFine-tuningを行った。さらに、構築した金融ニュース等自動サマリーシステムの検証研究を行った。まず、二つの既存の簡単なコーパスDUC-2003とDUC-2004 (P.Over et.al., 2007)を用いて構築した金融ニュース等自動サマリーシステムの検証を行った。次に、金融等ニュースWebサイトから最近の金融ニュースと人間が作ったBullet Pointsに基づいて新しいコーパスの構築を行い、これを用いて提案システムの検証を行った。
|