2022 Fiscal Year Annual Research Report
Construction of metric space for datasets and learning algorithms
Project/Area Number |
22H03620
|
Allocation Type | Single-year Grants |
Research Institution | National Institute of Informatics |
Principal Investigator |
佐藤 真一 国立情報学研究所, コンテンツ科学研究系, 教授 (90249938)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 学習データ / 学習アルゴリズム / 計量空間 / 転移学習 |
Outline of Annual Research Achievements |
深層学習等機械学習に基づく手法は、タスクを規定するデータセットに基づき、学習アルゴリズムにより処理器を生成し、その性能評価はデータセットにより行う。データセットに応じた学習アルゴリズムの検討、学習アルゴリズムの解析・評価に適したデータセットの選択等は本質的に重要である。本研究では、こうしたデータセットや学習アルゴリズムをより深く解析するための、データセット並びに学習アルゴリズムの計量に関する研究を行う。データセット間の距離比較ができるデータセット計量ベクトル空間、学習アルゴリズム間の距離比較ができる学習アルゴリズム計量ベクトル空間、さらにはこれらを統合してデータセットと学習アルゴリズムとの間の距離比較ができる計量ベクトル空間の実現を目指す。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。 2022年度は主としてデータセットの計量空間の構築法について検討を行った。より具体的には、複数のデータセットについて特定のタスク(これもデータセットにより定義される)への転移可能性を示すようなベクトル空間の構築法を提案し、実際に転移学習を実施することなく転移可能性のより高いデータセットを効果的に選別可能であることを示した。この空間がデータセット計量空間として利用可能であると考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データセットの計量空間について予定通り検討が進んだ。
|
Strategy for Future Research Activity |
次年度以降は学習アルゴリズムの計量についての検討を進めていく予定である。
|