研究課題/領域番号 |
22H03653
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 統計数理研究所 |
研究代表者 |
日野 英逸 統計数理研究所, モデリング研究系, 教授 (10580079)
|
研究分担者 |
藤木 淳 福岡大学, 理学部, 教授 (10357907)
赤穗 昭太郎 統計数理研究所, 大学統計教員育成センター, 特任教授 (40356340)
村田 昇 早稲田大学, 理工学術院, 教授 (60242038)
|
研究期間 (年度) |
2022-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
16,510千円 (直接経費: 12,700千円、間接経費: 3,810千円)
2023年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 情報幾何学 / 機械学習 / 転移学習 / 情報幾何 |
研究開始時の研究の概要 |
機械学習により予測モデルを学習する際に利用できるデータと,運用時のデータの性質が異なる状況は,例えばある地域でのデータで学習して他の地域での予測を行う時や,過去のデータを用いて将来の予測をするという問題設定で普遍的に生じうるものであり,機械学習の実世界利用においては避けて通れない.本研究は,分布シフト手法の情報幾何的解析,勾配流によるターゲットドメインデータ拡張と学習可能性,地域性・個別性の顕著な領域への機械学習の応用,という3つの課題に取り組み,幾何学的視点を通した転移学習問題の統一的表現と,それによる現状の手法の問題点の明確化,その問題点を克服する新規手法の開発を目的とするものである.
|
研究実績の概要 |
ドメイン適応において、ソースドメインとターゲットドメインの距離が大きい場合、予測性能が低下してしまう。このような問題を解決する方法として、ソースドメインからターゲットドメインへ徐々に移行する中間ドメインを利用する方法がある。これまでの研究では、中間領域のサンプル数が十分に多いことが前提となっていたため、ラベル付きデータを必要とせず自己学習が可能であった。しかし、アクセス可能な中間領域の数が制限されると、領域間の距離が大きくなり、自己学習がうまくいかなくなる。中間領域のサンプルのコストは現実的に様々であり、中間領域がターゲット領域に近いほど中間領域からのサンプルの取得コストが高くなると考えるのが自然である。コストと精度のトレードオフを解決するために、マルチフィデリティとアクティブドメイン適応を組み合わせたフレームワークを開発し、その有効性を、実世界のデータセットを用いた実験により評価した。 多くの機械学習手法は、学習データとテストデータが同じ分布に従うと仮定している。しかし、現実世界ではこの仮定が破られることが多い。特に、共変量シフトと呼ばれる、データの変化による限界分布は、機械学習における最も重要な研究テーマの1つである。よく知られた共変量シフト適応法のファミリーを、情報幾何学の枠組みで統一的に記述した。さらに、幾何学的に一般化された共変量シフト適応法のパラメータ探索が効率的に実現できることを示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初の計画の一つの柱であった,情報幾何学的な観点からの共変量シフトのためのアルゴリズムの統一的な解析の端緒を開くことができた.また,ソースドメインとターゲットドメインへのデータ分布の変動をモデル化するための第一歩として,段階的ドメイン適応の問題に取り組み,能動的かつmulti-fidelity的な問題設定における学習アルゴリズムを開発した. 開発技術の応用先として有望な地球科学分野における研究を並行で推進し,論文として成果を出すことができた.
|
今後の研究の推進方策 |
能動的段階的ドメイン適応の研究を通して,勾配流あるいはノーマライジングフローを用いた生成的段階的ドメイン適応の着想を得た.これを定式化・実装し,その性能解析と実験評価を行う. 引き続き地球科学及び脳神経科学の研究者と連携し,個別性の顕著な領域における転移学習技術の展開を検討する.
|