2023 Fiscal Year Research-status Report
複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類
Project/Area Number |
22K12146
|
Research Institution | University of Yamanashi |
Principal Investigator |
鈴木 良弥 山梨大学, 大学院総合研究部, 教授 (20206551)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 半教師あり学習 / マルチラベル文書分類 / 言い換え生成 / 抽象型要約生成 / マルチタスク学習 / データ拡張 |
Outline of Annual Research Achievements |
現在実施中の「複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類」についての研究の令和5年度の実施計画は「大域的なノイズ生成手法,及びデータ拡張手法を提案」し,「実験の成果と公開」を行うことであった. 令和5年度はそのうち「言い換え生成と抽象型要約生成手法の提案」を中心に研究を進めた.その結果,多くの良質な言い換えを生成することができ,"Learning Disentangled Meaning and Style Representations for Positive Text Reframing"という論文を "The 16th International Natural Language Generation Conference" に投稿し,採択された.また,"Decoupling Style from Contents for Positive Text Reframing" という論文を "ICONIP2023(30th International Conference on Neural Information Processing)" に投稿し,採択された.また,言語処理学会の年次大会でも"Event-Centered Prompting for Text Style Transfer"という題目で研究発表を行った.抽象型要約生成手法についても現在実験を行っており,良い結果を得ているため,令和6年度中に国際会議で研究成果を発表する予定である.「4種の言語タスクを用いたデータ拡張法の開発」については現在実験中であり,実験終了後すぐに論文執筆にとりかかる予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
令和5年度の実施計画は「言い換え生成と抽象型要約生成手法の提案」と「4種の言語タスクを用いたデータ拡張法の開発,及び実験・評価と成果の公開」であった.そのうち「言い換え生成手法の提案」については研究が進み,2本の論文("Learning Disentangled Meaning and Style Representations for Positive Text Reframing","Decoupling Style from Contents for Positive Text Reframing")が国際会議に採択され,国内会議でも"Event-Centered Prompting for Text Style Transfer"というtitleで発表することができたが,「抽象型要約生成手法の提案」については論文執筆中である.「4種の言語タスクを用いたデータ拡張法の開発」については現在実験中であり,実験終了後すぐに論文執筆にとりかかる予定である.
|
Strategy for Future Research Activity |
令和5年度実施計画で現在進行中の「大域的なノイズ生成手法,およびデータ拡張法の開発」は令和6年度実施予定の「マルチタスク学習の開発,及び実験・評価と成果の公開」と同時に実施可能であるので,令和6年は両方の研究を並行して実施する.具体的には令和5年中に実施予定であった「4種の言語タスクを用いたデータ拡張法の開発」についてはこれまで研究してきた4種の言語タスク,すなわち(1)分野依存語義の同定,(2)構文構造に基づく能動・受動変換,(3)言い換え生成,(4)抽象型要約生成を用いたデータ拡張の実験を6月中に終わらせ,国際会議で成果報告を行う予定である.令和6年度「マルチタスク学習の開発」は10月までに行い,実験・評価を行った後,国際会議に投稿し,成果を公開する予定である.令和6年度実施予定のマルチタスク学習に関する実験は多大な計算量が必要になるため,令和6年度購入予定の計算サーバ(GPU NVIDIA A100)を用いて実施する予定である.
|
Causes of Carryover |
令和5年度は当初の研究計画である「言い換え生成と抽象型要約生成手法の提案」について実施を行った.特に言い換え生成によるデータ拡張について実施したが,小さなデータで実施したため,最新の開発用PCを購入せずに既存の開発用PCを用いて実施し,一定の成果を得た.令和6年度は「4種の言語タスクを用いたデータ拡張法の開発」とマルチタスク学習を行うが,これらは計算量が多いため,当初購入予定だった高性能な開発用PCを購入し実験を行う予定である.
|