研究課題/領域番号 |
22K12146
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 山梨大学 |
研究代表者 |
鈴木 良弥 山梨大学, 大学院総合研究部, 教授 (20206551)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 半教師あり学習 / マルチラベル文書分類 / 言い換え生成 / 抽象型要約生成 / マルチタスク学習 / データ拡張 / 分野依存語義 / 能動・受動変換 |
研究開始時の研究の概要 |
本研究では膨大なラベル数を対象とした半教師ありマルチラベル分類において,高精度な分類を行うためのデータ拡張手法を開発することを目指す.データ拡張手法として語彙,句,文,及び文書の各々において意味の等価性が前提となる4種の言語処理タスクを半教師あり学習におけるデータ拡張に利用する.これらの言語処理タスクをマルチラベル文書分類の補助タスクとして活用することにより,双方の向上を目指す手法を開発する.
|
研究実績の概要 |
現在実施中の「複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類」についての研究の令和5年度の実施計画は「大域的なノイズ生成手法,及びデータ拡張手法を提案」し,「実験の成果と公開」を行うことであった. 令和5年度はそのうち「言い換え生成と抽象型要約生成手法の提案」を中心に研究を進めた.その結果,多くの良質な言い換えを生成することができ,"Learning Disentangled Meaning and Style Representations for Positive Text Reframing"という論文を "The 16th International Natural Language Generation Conference" に投稿し,採択された.また,"Decoupling Style from Contents for Positive Text Reframing" という論文を "ICONIP2023(30th International Conference on Neural Information Processing)" に投稿し,採択された.また,言語処理学会の年次大会でも"Event-Centered Prompting for Text Style Transfer"という題目で研究発表を行った.抽象型要約生成手法についても現在実験を行っており,良い結果を得ているため,令和6年度中に国際会議で研究成果を発表する予定である.「4種の言語タスクを用いたデータ拡張法の開発」については現在実験中であり,実験終了後すぐに論文執筆にとりかかる予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
令和5年度の実施計画は「言い換え生成と抽象型要約生成手法の提案」と「4種の言語タスクを用いたデータ拡張法の開発,及び実験・評価と成果の公開」であった.そのうち「言い換え生成手法の提案」については研究が進み,2本の論文("Learning Disentangled Meaning and Style Representations for Positive Text Reframing","Decoupling Style from Contents for Positive Text Reframing")が国際会議に採択され,国内会議でも"Event-Centered Prompting for Text Style Transfer"というtitleで発表することができたが,「抽象型要約生成手法の提案」については論文執筆中である.「4種の言語タスクを用いたデータ拡張法の開発」については現在実験中であり,実験終了後すぐに論文執筆にとりかかる予定である.
|
今後の研究の推進方策 |
令和5年度実施計画で現在進行中の「大域的なノイズ生成手法,およびデータ拡張法の開発」は令和6年度実施予定の「マルチタスク学習の開発,及び実験・評価と成果の公開」と同時に実施可能であるので,令和6年は両方の研究を並行して実施する.具体的には令和5年中に実施予定であった「4種の言語タスクを用いたデータ拡張法の開発」についてはこれまで研究してきた4種の言語タスク,すなわち(1)分野依存語義の同定,(2)構文構造に基づく能動・受動変換,(3)言い換え生成,(4)抽象型要約生成を用いたデータ拡張の実験を6月中に終わらせ,国際会議で成果報告を行う予定である.令和6年度「マルチタスク学習の開発」は10月までに行い,実験・評価を行った後,国際会議に投稿し,成果を公開する予定である.令和6年度実施予定のマルチタスク学習に関する実験は多大な計算量が必要になるため,令和6年度購入予定の計算サーバ(GPU NVIDIA A100)を用いて実施する予定である.
|