Project/Area Number |
23K24876
|
Project/Area Number (Other) |
22H03620 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | National Institute of Informatics |
Principal Investigator |
佐藤 真一 国立情報学研究所, コンテンツ科学研究系, 教授 (90249938)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2024: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2023: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2022: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
|
Keywords | 学習データ / 学習アルゴリズム / 計量空間 / 転移学習 / 機械学習 / データセット / 学習アルゴリズム評価 / 学習データ評価 |
Outline of Research at the Start |
本研究では、データセット間の距離比較ができるデータセット計量ベクトル空間、学習アルゴリズム間の距離比較ができる学習アルゴリズム計量ベクトル空間、さらにはこれらを統合してデータセットと学習アルゴリズムとの間の距離比較ができる計量ベクトル空間の実現を目指す。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。
|
Outline of Annual Research Achievements |
深層学習等機械学習に基づく手法は、タスクを規定するデータセットに基づき、学習アルゴリズムにより処理器を生成し、その性能評価はデータセットにより行う。データセットに応じた学習アルゴリズムの検討、学習アルゴリズムの解析・評価に適したデータセットの選択等は本質的に重要である。本研究では、こうしたデータセットや学習アルゴリズムをより深く解析するための、データセット並びに学習アルゴリズムの計量に関する研究を行う。データセット間の距離比較ができるデータセット計量ベクトル空間、学習アルゴリズム間の距離比較ができる学習アルゴリズム計量ベクトル空間、さらにはこれらを統合してデータセットと学習アルゴリズムとの間の距離比較ができる計量ベクトル空間の実現を目指す。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。 2023年度は主として、データセットのうちタスクを遜色なく学習できるような重要なデータのみを選択する、コアセット選択手法について集中的に検討を行った。特に、データセットの分布をより適切に表現できる計量手法について提案し、より性能の良いコアセット選択を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データセットの分布を評価する新たな計量手法を考案し、効果的な子アセット選択手法を提案できており、順調に進捗している。
|
Strategy for Future Research Activity |
タスクとしてこれまで主として識別問題を想定してきたが、実は検索問題(ランキング問題)として考えると、広くコミュニティで検討されてきている手法がうまく機能しない場合があることを発見した。2024年度は最終年度であり、これまでの成果をまとめると同時に、検索問題についての展開を検討したい。
|