Bilevel Optimization for Training Generalizable Language Models

Research Project

Project/Area Number	23K16940
Research Category	Grant-in-Aid for Early-Career Scientists
Allocation Type	Multi-year Fund
Review Section	Basic Section 61030:Intelligent informatics-related
Research Institution	The University of Tokyo
Principal Investigator	磯沼大東京大学, 大学院工学系研究科(工学部), 客員研究員 (90854191)
Project Period (FY)	2023-04-01 – 2026-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000) Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000) Fiscal Year 2024: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000) Fiscal Year 2023: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Keywords	自然言語処理 / 機械学習 / 大規模言語モデル / 言語モデル
Outline of Research at the Start	近年自然言語処理分野では、複数のタスクとその指示を同時に学習することで、任意の指示を解釈し未知のタスクを柔軟に解ける汎用言語モデルの実現が試みられている。しかし、既存モデルの汎化性能は改善余地が大きく、学習するタスクやその指示内容により汎化性能は大きく改善することが知られている。本研究はタスクの重みや指示内容といった学習方法を二段階最適化の枠組みにより最適化するアプローチを提案し、汎化性能が向上することを明らかにする。
Outline of Annual Research Achievements	近年、ChatGPTをはじめとしたプロンプトを与えることで幅広いタスクに対応できる汎用言語モデルの発展が目覚ましい。汎用言語モデルを学習する方法として、タスクごとにプロンプトを用意し、プロンプトを与えたときにそのタスクを解けるようマルチタスク学習を行うことで言語モデルがプロンプトを解釈できるようにするinstruction tuningという方法が注目されている。これまで様々な学習用プロンプトがinstruction tuningのために作成されているが、どのようなプロンプトがモデルの汎化性能向上に最適なのか明らかになっておらず、その最適化に膨大な人的コストを要している。本期間では学習用プロンプトを二段階最適化により最適化するinstruction optimizationを提案し、instruction tuningに最適な学習用プロンプトを明らかにした。具体的には、学習用プロンプトで言語モデルを学習し、学習した言語モデルの汎化性能を最大化するように学習用プロンプトを最適化する。これを繰り返すことで、汎化性能向上に最適なプロンプトを獲得した。評価実験において、タスクの指示をプロンプトに用いる実験設定では、二段階最適化によりプロンプトを多様化することが汎化性能向上に有効である一方、タスクの例示をプロンプトに用いる実験設定では、多様な種類の例示ではなく同一の例示を用いる方が有効であることが明らかになった。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本期間では、二段階最適化を行う対象としてプロンプトの最適化を試み、プロンプト最適化により汎化性能が向上することを示した。研究成果はFindings of ACLに採択されたほか、2023年度人工知能学会全国大会で優秀賞をいただくなど、一定の成果が得られたものと認識している。
Strategy for Future Research Activity	本期間では、プロンプトの二段階最適化に取り組んだが、今後は学習データセットの二段階最適化に取り組みたい。学習データセットの二段階最適化により、言語モデルの学習コストを下げつつ、汎化性能向上に資する学習データとは何か明らかにしていく。

Report

(1 results)

2023 Research-status Report

Research Products
(9 results)

All 2024 2023 Other

All Int'l Joint Research (2 results) Journal Article (3 results) (of which Peer Reviewed: 3 results, Open Access: 3 results) Presentation (4 results)

[Int'l Joint Research] University of Edinburgh(英国)
- Related Report
  2023 Research-status Report
[Int'l Joint Research] University of Amsterdam(オランダ)
- Related Report
  2023 Research-status Report
[Journal Article] Differentiable Instruction Optimization for Cross-Task Generalization2023
- Author(s)
  Masaru Isonuma, Junichiro Mori, Ichiro Sakata
- Journal Title
  
  Findings of the Association for Computational Linguistics: ACL 2023
  
  Volume: Findings of ACL 2023 Pages: 10502-10517
- DOI
  10.18653/v1/2023.findings-acl.667
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] Dynamic Structured Neural Topic Model with Self-Attention Mechanism2023
- Author(s)
  Nozomu Miyamoto, Masaru Isonuma, Sho Takase, Junichiro Mori, Ichiro Sakata
- Journal Title
  
  Findings of the Association for Computational Linguistics: ACL 2023
  
  Volume: Findings of ACL 2023 Pages: 5916-5930
- DOI
  10.18653/v1/2023.findings-acl.366
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] SciReviewGen: A Large-scale Dataset for Automatic Literature Review Generation2023
- Author(s)
  Tetsu Kasanishi, Masaru Isonuma, Junichiro Mori, Ichiro Sakata
- Journal Title
  
  Findings of the Association for Computational Linguistics: ACL 2023
  
  Volume: Findings of ACL 2023 Pages: 6695-6715
- DOI
  10.18653/v1/2023.findings-acl.418
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access
[Presentation] 逆学習による言語モデルの解析2024
- Author(s)
  磯沼大, イヴァンチトフ
- Organizer
  言語処理学会第30回年次大会
- Related Report
  2023 Research-status Report
[Presentation] 人工画像を用いたText-to-Imageモデルの事前学習2024
- Author(s)
  中尾純平, 磯沼大, 片岡裕雄, 森純一郎, 坂田一郎
- Organizer
  言語処理学会第30回年次大会
- Related Report
  2023 Research-status Report
[Presentation] 汎用言語モデル学習のためのプロンプト最適化2023
- Author(s)
  磯沼大, 森純一郎, 坂田一郎
- Organizer
  人工知能学会第37回全国大会
- Related Report
  2023 Research-status Report
[Presentation] Text-to-Imageモデルの学習における最適キャプションの探索2023
- Author(s)
  中尾純平, 磯沼大, 森純一郎, 坂田一郎
- Organizer
  人工知能学会第37回全国大会
- Related Report
  2023 Research-status Report

Bilevel Optimization for Training Generalizable Language Models

Principal Investigator

磯沼 大 東京大学, 大学院工学系研究科(工学部), 客員研究員 (90854191)

¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)

Current Status of Research Progress

Reason

Report

Research Products

[Int'l Joint Research] University of Edinburgh(英国)

Related Report

[Int'l Joint Research] University of Amsterdam(オランダ)

Related Report

[Journal Article] Differentiable Instruction Optimization for Cross-Task Generalization2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Dynamic Structured Neural Topic Model with Self-Attention Mechanism2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] SciReviewGen: A Large-scale Dataset for Automatic Literature Review Generation2023

Author(s)

Journal Title

DOI

Related Report

[Presentation] 逆学習による言語モデルの解析2024

Author(s)

Organizer

Related Report

[Presentation] 人工画像を用いたText-to-Imageモデルの事前学習2024

Author(s)

Organizer

Related Report

[Presentation] 汎用言語モデル学習のためのプロンプト最適化2023

Author(s)

Organizer

Related Report

[Presentation] Text-to-Imageモデルの学習における最適キャプションの探索2023

Author(s)

Organizer

Related Report

磯沼大東京大学, 大学院工学系研究科(工学部), 客員研究員 (90854191)