Project/Area Number |
23K19966
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
1001:Information science, computer engineering, and related fields
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
豊田 祥史 統計数理研究所, 先端データサイエンス研究系, 特任研究員 (10984718)
|
Project Period (FY) |
2023-08-31 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | 機械学習 / 統計学 |
Outline of Research at the Start |
深層学習によるデータからの学習法の急速な発展により, 高性能な人工知能の実現が可能となっている. しかし, 深層学習により学習された人工知能は, 学習データを生起した分布とは異なる分布から生起されたデータに対しては正しい推論ができないことが知られている. この問題の有力な解決法として,不変学習という方法論が近年注目を集めているが, 学習データを収集する際に高いアノテーションコストを要するため, 実装の障壁が高いことが知られている. 本研究では, 学習済み人工知能を用いた疑似ラベル付与に基づくアイデアにより, 不変学習のアノテーションコスト削減を目指す.
|
Outline of Annual Research Achievements |
深層学習の発展による効率的なデータからの学習法の確立により, 画像識別タスクにおいて, 人間と同等の性能を誇る人工知能の実現が可能となった. しかし, 深層学習により得られた人工知能は, 学習データを生起した分布の外から発生したデータに対しては, 十分な性能は発揮できないことが知られており, この問題は分布外汎化問題という名の下, 機械学習分野の重要な問題として国際的に認知されている. 本研究では, 分布外汎化問題の有力な解決策として知られているInvariant Risk Minimization(IRM)という方法に関して, 1. 学習時に必要なアノテーションコストの低減, 2. 理論的正当性の付与, という二つの観点からIRMの実社会での使用の障壁を下げることを目標としていた. 1.に関しては, 特定の設定下において, IRMは理論上も, 分布外汎化問題の有力な方策であることを厳密に証明することに成功した. 2.に関しては, 学習済み人工知能による疑似ラベル付与というアイデアで, IRMのアノテーションコストの削減を試みた. その第一段階として, ImageNetと呼ばれる簡素なベンチマークにてアイデアの有効性を検証した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
Invariant Risk Minimizationの理論保証に関する研究は, 2023年度中で論文誌掲載まで至り, 疑似ラベルアノテーションの研究も部分的にうまくいっている状況を考えると, おおむね順調に研究が進んでいると判断できる.
|
Strategy for Future Research Activity |
今後は, 疑似ラベルアノテーション研究の有効性をより実用的なデータで検証し, 論文化することを目指したい.
|