• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模言語モデルのための品質保証技術に関する研究

研究課題

研究課題/領域番号 24K02920
研究種目

基盤研究(B)

配分区分基金
応募区分一般
審査区分 小区分60050:ソフトウェア関連
研究機関東京大学

研究代表者

馬 雷  東京大学, 大学院情報理工学系研究科, 准教授 (70842061)

研究分担者 宮尾 祐介  東京大学, 大学院情報理工学系研究科, 教授 (00343096)
佐藤 周行  国立情報学研究所, 国立情報学研究所・アーキテクチャ科学 研究系・教授, 教授 (20225999)
趙 建軍  九州大学, システム情報科学研究院, 教授 (20299580)
石川 冬樹  国立情報学研究所, アーキテクチャ科学研究系, 准教授 (50455193)
研究期間 (年度) 2024-04-01 – 2027-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
18,330千円 (直接経費: 14,100千円、間接経費: 4,230千円)
2026年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2025年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2024年度: 6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
キーワード品質保証 / LLM / 信頼性 / 分析 / テスト
研究開始時の研究の概要

最近,大規模言語モデル(LLM)は,ソフトウェア工学(SE)や自然言語処理(NLP)などの分野で, 多くの実世界の応用において性能の大幅な向上を達成している. しかし, このようなLLM ソフトウェアの品質や信頼性に関しては, まだ非常に初期の段階にあり, 社会的な懸念や新たな技術的課題が生じている. 特に, 最近産業界でLLMを応用する傾向が増えており, LLM ソフトウェアの品質保証方法についての緊急の必要性がある. 本研究は, LLM ソフトウェアの品質保証技術に関する一連の提案を行い, 早期に基盤を確立することを目的としている.

研究実績の概要

過去1年間で、大規模言語モデル(LLM)の品質保証において大きな進展があった。モデルベースの分析に基づいて、我々の研究は従来の手法を発展させ、包括的な品質保証および実践的応用のための新たな技術を導入したLUNAを開発した。LUNAは、抽象モデル構築の中核を担っている。さらに、PrivAuditorを設計と開発して、LLM適応手法におけるデータ保護の脆弱性を体系的にベンチマークすることで、LLM品質保証におけるプライバシー強化のための重要な知見を提供する。

その他の関連研究も貴重な視点を調査する。頑健性やドメイン汎化に関する初期研究は、モデルの適応性向上のための策略に寄与しており、学習ベースの修復手法はニューラルネットワークのオンラインおよびオフラインでの修正の可能性を示した。LLMのさまざまな分野への応用を推進し、これらモデルの影響力と実用性の拡大に貢献している。これらの取り組みは、次世代のLLM品質保証研究に対して有益である。これらの成果は、信頼できる安全なLLMシステムの継続的な発展に向けた強固な基盤を築いている。

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

まず、我々はLUNAというLLM向けの抽象モデルベース分析フレームワークを構築した。このフレームワークは、厳格な査読を経て、Top Tier Internationalの学術雑誌IEEE Transactions on Software Engineering(Impact Factor 6.5)に採択されている。このフレームワークの成功により、LLMの体系的な分析が可能となり、今後LLM分析の基礎となる。さらに、信頼性の様々な側面を評価する関連研究も行っており、その成果は国際会議で発表された。結論として、本研究プロジェクトは順調に進展している。

今後の研究の推進方策

今後、LLM分析フレームワークをさらに強化し、より広範かつ実践的な応用を支援することを計画している。まず、現行のフレームワークを複数のモデル間の相互作用を含むマルチエージェントLLMシステムへ拡張することを目指す(RO1-2)。次に、LLM修復フレームワークの初期的な探索を開始する(RO3)。最後に、ソフトウェア工学分野で、LLMによる自動コード生成の信頼性を高め、開発者が多様なタスクをより効率的に遂行できるパイプラインを構築する(RO4)。これらの取り組み全体を通じて、様々な信頼性の観点から包括的な評価も実施する。

報告書

(1件)
  • 2024 実施状況報告書
  • 研究成果

    (6件)
  • 研究データ

    (1件)

すべて 2024

すべて 雑誌論文 (6件) (うち国際共著 6件、 査読あり 6件、 オープンアクセス 6件)

  • [雑誌論文] Hand Gesture Classification Using sEMG Signals: Nearest-Centroid-Based Methodology With DBA2024

    • 著者名/発表者名
      Zhang Lingfeng、Wan Zunian、Ding Yepeng、Hu Tao、Ogawa Takefumi、Sato Hiroyuki
    • 雑誌名

      IEEE Access

      巻: 12 ページ: 141916-141931

    • DOI

      10.1109/access.2024.3467158

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] LUNA: A Model-Based Universal Analysis Framework for Large Language Models2024

    • 著者名/発表者名
      Song Da、Xie Xuan、Song Jiayang、Zhu Derui、Huang Yuheng、Juefei-Xu Felix、Ma Lei
    • 雑誌名

      IEEE Transactions on Software Engineering

      巻: 50 号: 7 ページ: 1921-1948

    • DOI

      10.1109/tse.2024.3411928

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Benchmarking Object Detection Robustness against Real-World Corruptions2024

    • 著者名/発表者名
      Liu Jiawei、Wang Zhijie、Ma Lei、Fang Chunrong、Bai Tongtong、Zhang Xufan、Liu Jia、Chen Zhenyu
    • 雑誌名

      International Journal of Computer Vision

      巻: 132 号: 10 ページ: 4398-4416

    • DOI

      10.1007/s11263-024-02096-6

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Domain Generalization of 3D Object Detection by Density-Resampling2024

    • 著者名/発表者名
      Li Shuangzhi、Ma Lei、Li Xingyu
    • 雑誌名

      Computer Vision - ECCV 2024 Volume 15122, pp. 456-473, 2024 (The 18th European Conference on Computer Vision (ECCV 2024), 2024)

      巻: 1 ページ: 456-473

    • DOI

      10.1007/978-3-031-73039-9_26

    • ISBN
      9783031730382, 9783031730399
    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] MetaRepair: Learning to Repair Deep Neural Networks from Repairing Experiences2024

    • 著者名/発表者名
      Xing Yun、Guo Qing、Cao Xiaofeng、Tsang Ivor W.、Ma Lei
    • 雑誌名

      Proceedings of the 32nd ACM International Conference on Multimedia

      巻: 1 ページ: 1781-1790

    • DOI

      10.1145/3664647.3680638

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] PrivAuditor: Benchmarking Data Protection Vulnerabilities in LLM Adaptation Techniques2024

    • 著者名/発表者名
      Derui Zhu, Dingfan Chen, Xiongfei Wu, Jiahui Geng, Zhuo Li, Jens Grossklags, Lei Ma
    • 雑誌名

      Advances in Neural Information Processing Systems 38 Annual Conference on Neural Information Processing Systems 2024 2024 (2024 Conference on Neural Information Processing Systems (NeurIPS 2024))

      巻: NA

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著

すべて 2026

  • Dataset for multi-channel surface electromyography (sEMG) signals of hand gestures2026

    • 資金配分機関
      • 資金配分機関名
        日本学術振興会
      • e-Rad資金配分機関ID
        1025
      • Crossref Funder Registry資金配分機関ID

        https://doi.org/10.13039/501100001691

      • 体系的番号
        JP24K02920
      • プロジェクト名
        大規模言語モデルのための品質保証技術に関する研究
    • データの名称
      Dataset for multi-channel surface electromyography (sEMG) signals of hand gestures
    • 掲載日
      2026-04-06
    • データの説明(抄録・要旨)
      AIによるclassificationのひとつの例題として脳波を使ったジェスチャの分類を扱った。方法論としてLLMの前段階としてDBAを用い、この期にBERT等を適用するための準備段階の論文となった
    • データの分野
      情報通信
    • データ種別
      データセット
    • 管理対象データの利活用・提供方針
      無償、CC BY 4.0、(参照)https://creativecommons.org/licenses/by/4.0/
    • アクセス種別
      公開
    • リポジトリ情報
      Mendeley(https://data.mendeley.com/datasets/ckwc76xr2z/2)
    • URI

      https://ieeexplore.ieee.org/document/10689531

    • DOI

      10.17632/ckwc76xr2z.2

    • データ管理者情報
      • データ管理者情報種別
        データ管理者
      • データ管理者情報
        Elsevier Japan KK (Corporate Office) 1-9-15 Higashi-Azabu, Minato-Ku Tokyo 4, Japan
      • データ管理者情報種別
        データ管理機関
      • データ管理者情報
        Elsevier
      • データ管理者情報種別
        データ管理者の連絡先
      • データ管理者情報
        info*mendeley.com (メールアドレスは「@」を「*」に置換しています。)
    • データNo.

      JP24K02920-2024-0001

    • 関連する報告書
      2024 実施状況報告書

URL: 

公開日: 2024-04-11   更新日: 2026-04-14  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi