2024 Fiscal Year Research-status Report
有価証券報告書内の段落、文に対する階層的な将来見通しのトーン判定と説明可能性
| Project/Area Number |
23K28149
|
| Allocation Type | Multi-year Fund |
| Research Institution | Kyushu University |
Principal Investigator |
池田 大輔 九州大学, システム情報科学研究院, 准教授 (00294992)
|
| Co-Investigator(Kenkyū-buntansha) |
大石 桂一 九州大学, 経済学研究院, 教授 (10284605)
姫 艶彦 城西国際大学, 経営情報学部, 助教 (20962864)
原口 健太郎 西南学院大学, 商学部, 准教授 (40846523)
|
| Project Period (FY) |
2024-04-01 – 2027-03-31
|
| Keywords | 極性判定 / MD&A / 極性辞書 / 深層学習 / 事前学習モデル |
| Outline of Annual Research Achievements |
本研究の目的は『比較的長文で階層構造を持ち、非明示的な意図がある文書に対し、トーンの階層的な分類が可能か?』どうかを明らかにすることであり、有価証券報告書内の「経営者による財政状態、経営成績及びキャッシュ・フローの状況の分析」(Management Discussion and Analysisを略してMD&Aと呼ばれる)に書かれた将来的な見通しがポジティブかどうかの分析、トーン分析(情報系では極性判定とも)を行う。 この目的に至るマイルストーンとして、階層を考えない文書単位および文単位の教師あり学習の両アプローチからの分類を行う。次に、中間の単位である段落単位の分類を行い、最後に、これらを統合した階層的な分類を行う。 これまでに、文単位でのトーン判定を、極性辞書を用いたアプローチと深層学習を用いたアプローチで実施した。 2024年度は、文単位から段落単位の文章へトーン判定の手法を拡張した。ただし、本研究の主な対象であるMD&Aのデータセットでは、文単位でのラベルしか付与されていないので、標準的な極性判定用のデータセットを用いて、段落単位でのトーン判定の有効性を確認した。 また、主な解析対象であるMD&A以外にも、レビュー等のテキストを対象にして極性判定を行い、他にデータセットが解析結果に与える性質や学習結果の説明可能性についての研究も行った。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定していた段落単位のトーン判定を行い、国際会議で発表した。さらに、当初予定していなかったが、レビュー文を用いた極性判定を用いて年代別の意思決定についての知見を得ることができた。この結果は国際会議で発表の上、論文誌に採択された。さらに、トーン判定の精度に影響を与えるデータセットの性質についての解析や学習結果の説明可能性の研究も進めることができた。一方で、MD&Aについての段落単位でのデータ整備は予定通りには進まなかった。
|
| Strategy for Future Research Activity |
遅れているデータセットをまず整備した上で、段落単位でのトーン判定をMD&Aの文書を対象に行う。手法の実装には、2025年度に購入予定のGPU付きの高性能計算サーバを用いる。また作成した訓練例も、データジャーナルへの投稿した上で、データセットとして公開する予定である。
|
| Causes of Carryover |
今年度、学会発表や論文投稿が予想以上に多くなり、当初予定していたGPU付き高性能計算サーバの購入をあきらめ、成果発表に多くの予算をかけた。サーバの金額の全体を成果発表に用いたわけではなく、残額を来年度の予算とあわせてサーバの購入にあてる。
|