• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Construction of metric space for datasets and learning algorithms

Research Project

Project/Area Number 23K24876
Project/Area Number (Other) 22H03620 (2022-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2022-2023)
Section一般
Review Section Basic Section 61010:Perceptual information processing-related
Research InstitutionNational Institute of Informatics

Principal Investigator

佐藤 真一  国立情報学研究所, コンテンツ科学研究系, 教授 (90249938)

Project Period (FY) 2022-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2024: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2023: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2022: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Keywords学習データ / 学習アルゴリズム / 計量空間 / 転移学習 / 機械学習 / データセット / 学習アルゴリズム評価 / 学習データ評価
Outline of Research at the Start

本研究では、データセット間の距離比較ができるデータセット計量ベクトル空間、学習アルゴリズム間の距離比較ができる学習アルゴリズム計量ベクトル空間、さらにはこれらを統合してデータセットと学習アルゴリズムとの間の距離比較ができる計量ベクトル空間の実現を目指す。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。

Outline of Annual Research Achievements

深層学習等機械学習に基づく手法は、タスクを規定するデータセットに基づき、学習アルゴリズムにより処理器を生成し、その性能評価はデータセットにより行う。データセットに応じた学習アルゴリズムの検討、学習アルゴリズムの解析・評価に適したデータセットの選択等は本質的に重要である。本研究では、こうしたデータセットや学習アルゴリズムをより深く解析するための、データセット並びに学習アルゴリズムの計量に関する研究を行う。データセット間の距離比較ができるデータセット計量ベクトル空間、学習アルゴリズム間の距離比較ができる学習アルゴリズム計量ベクトル空間、さらにはこれらを統合してデータセットと学習アルゴリズムとの間の距離比較ができる計量ベクトル空間の実現を目指す。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。
2023年度は主として、データセットのうちタスクを遜色なく学習できるような重要なデータのみを選択する、コアセット選択手法について集中的に検討を行った。特に、データセットの分布をより適切に表現できる計量手法について提案し、より性能の良いコアセット選択を実現した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

データセットの分布を評価する新たな計量手法を考案し、効果的な子アセット選択手法を提案できており、順調に進捗している。

Strategy for Future Research Activity

タスクとしてこれまで主として識別問題を想定してきたが、実は検索問題(ランキング問題)として考えると、広くコミュニティで検討されてきている手法がうまく機能しない場合があることを発見した。2024年度は最終年度であり、これまでの成果をまとめると同時に、検索問題についての展開を検討したい。

Report

(2 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • Research Products

    (5 results)

All 2024 2023 2022

All Journal Article (3 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Contributing Dimension Structure of Deep Feature for Coreset Selection2024

    • Author(s)
      Zhijing Wan, Zhixiang Wang, Yuran Wang, Zheng Wang, Hongyuan Zhu, and Shin'ichi Satoh
    • Journal Title

      Proc. of AAAI

      Volume: N/A

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Mitigating robust overfitting via self-residual-calibration regularization2023

    • Author(s)
      Liu Hong、Zhong Zhun、Sebe Nicu、Satoh Shin'ichi
    • Journal Title

      Artificial Intelligence

      Volume: 317 Pages: 103877-103877

    • DOI

      10.1016/j.artint.2023.103877

    • Related Report
      2023 Annual Research Report 2022 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Towards Robust Person Re-identification by Defending Against Universal Attackers2023

    • Author(s)
      Fengxiang Yang, Juanjuan Weng, Zhun Zhong, Hong Liu, Zheng Wang, Zhiming Luo, Donglin Cao, Shaozi Li, Shin'ichi Satoh, Nicu Sebe
    • Journal Title

      IEEE Transactions on Pattern Analysis and Machine Intelligence

      Volume: 45 Pages: 5218-5235

    • DOI

      10.1109/tpami.2022.3199013

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Presentation] WalkingDynamicsH36M: a Benchmarking Dataset for Long-term Motion and Trajectory Forecasting2023

    • Author(s)
      Cecilia Curreli, Andreu Girbau, and Shin'ichi Satoh
    • Organizer
      The 5th IEEE/CVF CVPR Precognition Workshop
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Predicting the Effect of Formula-driven Supervised Learning with Intrinsic Dimension2022

    • Author(s)
      Yusuke Kondo, Yoshihiro Fukuhara, Shin'ichi Satoh
    • Organizer
      第25回 画像の認識・理解シンポジウム
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi