研究課題/領域番号 |
22H03620
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 国立情報学研究所 |
研究代表者 |
佐藤 真一 国立情報学研究所, コンテンツ科学研究系, 教授 (90249938)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2022年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
|
キーワード | 機械学習 / データセット / 計量空間 / 学習データ / 学習アルゴリズム / 転移学習 / 学習アルゴリズム評価 / 学習データ評価 |
研究開始時の研究の概要 |
本研究では、学習用データセットや学習アルゴリズムをより深く解析するための、データセット並びに学習アルゴリズムの計量に関する研究を行う。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。
|
研究実績の概要 |
深層学習等機械学習に基づく手法は、タスクを規定するデータセットに基づき、学習アルゴリズムにより処理器を生成し、その性能評価はデータセットにより行う。データセットに応じた学習アルゴリズムの検討、学習アルゴリズムの解析・評価に適したデータセットの選択等は本質的に重要である。本研究では、こうしたデータセットや学習アルゴリズムをより深く解析するための、データセット並びに学習アルゴリズムの計量に関する研究を行う。データセット間の距離比較ができるデータセット計量ベクトル空間、学習アルゴリズム間の距離比較ができる学習アルゴリズム計量ベクトル空間、さらにはこれらを統合してデータセットと学習アルゴリズムとの間の距離比較ができる計量ベクトル空間の実現を目指す。これにより、相互に似た性質を持つデータセットや学習アルゴリズムの把握、多くのデータセットや学習アルゴリズムの主たる特徴にはどのようなものがあるのかの観測、新たなタスクに最も適した学習アルゴリズムの選択、転移学習のための事前学習モデルのために最も適した既存データセットの選択などが可能となる。 2022年度は主としてデータセットの計量空間の構築法について検討を行った。より具体的には、複数のデータセットについて特定のタスク(これもデータセットにより定義される)への転移可能性を示すようなベクトル空間の構築法を提案し、実際に転移学習を実施することなく転移可能性のより高いデータセットを効果的に選別可能であることを示した。この空間がデータセット計量空間として利用可能であると考えている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データセットの計量空間について予定通り検討が進んだ。
|
今後の研究の推進方策 |
次年度以降は学習アルゴリズムの計量についての検討を進めていく予定である。
|