Project/Area Number |
22K12146
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | University of Yamanashi |
Principal Investigator |
鈴木 良弥 山梨大学, 大学院総合研究部, 教授 (20206551)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
|
Keywords | 半教師あり学習 / マルチラベル文書分類 / 言い換え生成 / 抽象型要約生成 / マルチタスク学習 / データ拡張 / 分野依存語義 / 能動・受動変換 |
Outline of Research at the Start |
本研究では膨大なラベル数を対象とした半教師ありマルチラベル分類において,高精度な分類を行うためのデータ拡張手法を開発することを目指す.データ拡張手法として語彙,句,文,及び文書の各々において意味の等価性が前提となる4種の言語処理タスクを半教師あり学習におけるデータ拡張に利用する.これらの言語処理タスクをマルチラベル文書分類の補助タスクとして活用することにより,双方の向上を目指す手法を開発する.
|
Outline of Annual Research Achievements |
現在実施中の「複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類」についての研究の令和5年度の実施計画は「大域的なノイズ生成手法,及びデータ拡張手法を提案」し,「実験の成果と公開」を行うことであった. 令和5年度はそのうち「言い換え生成と抽象型要約生成手法の提案」を中心に研究を進めた.その結果,多くの良質な言い換えを生成することができ,"Learning Disentangled Meaning and Style Representations for Positive Text Reframing"という論文を "The 16th International Natural Language Generation Conference" に投稿し,採択された.また,"Decoupling Style from Contents for Positive Text Reframing" という論文を "ICONIP2023(30th International Conference on Neural Information Processing)" に投稿し,採択された.また,言語処理学会の年次大会でも"Event-Centered Prompting for Text Style Transfer"という題目で研究発表を行った.抽象型要約生成手法についても現在実験を行っており,良い結果を得ているため,令和6年度中に国際会議で研究成果を発表する予定である.「4種の言語タスクを用いたデータ拡張法の開発」については現在実験中であり,実験終了後すぐに論文執筆にとりかかる予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
令和5年度の実施計画は「言い換え生成と抽象型要約生成手法の提案」と「4種の言語タスクを用いたデータ拡張法の開発,及び実験・評価と成果の公開」であった.そのうち「言い換え生成手法の提案」については研究が進み,2本の論文("Learning Disentangled Meaning and Style Representations for Positive Text Reframing","Decoupling Style from Contents for Positive Text Reframing")が国際会議に採択され,国内会議でも"Event-Centered Prompting for Text Style Transfer"というtitleで発表することができたが,「抽象型要約生成手法の提案」については論文執筆中である.「4種の言語タスクを用いたデータ拡張法の開発」については現在実験中であり,実験終了後すぐに論文執筆にとりかかる予定である.
|
Strategy for Future Research Activity |
令和5年度実施計画で現在進行中の「大域的なノイズ生成手法,およびデータ拡張法の開発」は令和6年度実施予定の「マルチタスク学習の開発,及び実験・評価と成果の公開」と同時に実施可能であるので,令和6年は両方の研究を並行して実施する.具体的には令和5年中に実施予定であった「4種の言語タスクを用いたデータ拡張法の開発」についてはこれまで研究してきた4種の言語タスク,すなわち(1)分野依存語義の同定,(2)構文構造に基づく能動・受動変換,(3)言い換え生成,(4)抽象型要約生成を用いたデータ拡張の実験を6月中に終わらせ,国際会議で成果報告を行う予定である.令和6年度「マルチタスク学習の開発」は10月までに行い,実験・評価を行った後,国際会議に投稿し,成果を公開する予定である.令和6年度実施予定のマルチタスク学習に関する実験は多大な計算量が必要になるため,令和6年度購入予定の計算サーバ(GPU NVIDIA A100)を用いて実施する予定である.
|