研究課題/領域番号 |
19F19800
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 外国 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 早稲田大学 |
研究代表者 |
古月 敬之 早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (50294905)
|
研究分担者 |
LUO JIA 早稲田大学, 理工学術院, 外国人特別研究員
|
研究期間 (年度) |
2019-11-08 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
2,200千円 (直接経費: 2,200千円)
2021年度: 500千円 (直接経費: 500千円)
2020年度: 1,100千円 (直接経費: 1,100千円)
2019年度: 600千円 (直接経費: 600千円)
|
キーワード | 深層学習 / 言語モデル / 重要文抽出 / 関連分析 / サマリー生成 / 関連解析 / サンリ―生成 / 並列計算 / テキスト解析 |
研究開始時の研究の概要 |
本研究では、高度な関係性を抽出するための高性能な合成関係ネットワークを構築するディープラーニング技術と、GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行う。これをベースにして、テキスト文書の特徴抽出・関係分析により金融ニュースを解析し、Bullet Pointsに基づいた金融ニュース自動サマリーシステムの構築を行う。
|
研究実績の概要 |
本研究では、ディープラーニング技術に基づいた高度な関係性を抽出することができる高性能な合成関係ネットワークの構築と、GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行い、さらにこれらの技術をベースにしてテキスト文書の特徴抽出・関係分析の手法の開発を行う。これにより金融等のニュースを解析し、Bullet Pointsに基づいた金融等のニュース自動サマリーシステムを構築することを目標する。 この研究目標を実現するために、二つのテーマを分けて行う。テーマ①高度な関係性を抽出するための高性能な合成関係ネットワークを構築するディープラーニング技術、テーマ②GPUを用いた並列計算技術によるCNN、LSTM、GANの効率的なディープラーニングアルゴリズムの開発を行う。これを通して、金融等のニュース自動サマリーシステムを高性能化する。 本年では、前年度の引き続き金融等のニュース自動サマリーシステムの構築と性能向上を行った。例えば、注意力機構を適用した注意力関係ネットワークの構築やローカルコーパスを用いた言語モデルBERTとBARTのFine-tuningを行った。さらに、構築した金融ニュース等自動サマリーシステムの検証研究を行った。まず、二つの既存の簡単なコーパスDUC-2003とDUC-2004 (P.Over et.al., 2007)を用いて構築した金融ニュース等自動サマリーシステムの検証を行った。次に、金融等ニュースWebサイトから最近の金融ニュースと人間が作ったBullet Pointsに基づいて新しいコーパスの構築を行い、これを用いて提案システムの検証を行った。
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|