2023 Fiscal Year Annual Research Report
高次元・大規模・多ドメインデータの特徴抽出と情報統合による統計的学習
Project/Area Number |
19H04071
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
金森 敬文 東京工業大学, 情報理工学院, 教授 (60334546)
|
Co-Investigator(Kenkyū-buntansha) |
熊谷 亘 東京大学, 大学院工学系研究科(工学部), 特任助教 (20747167)
竹之内 高志 政策研究大学院大学, 政策研究科, 教授 (50403340)
松井 孝太 名古屋大学, 医学系研究科, 講師 (50737111)
川島 孝行 東京工業大学, 情報理工学院, 助教 (60846210)
武田 朗子 東京大学, 大学院情報理工学系研究科, 教授 (80361799)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 機械学習 |
Outline of Annual Research Achievements |
本研究では,データサイズ,次元,タイプなどが異なる多様なデータドメインにおける予測や推論のタスクを行うための学習アルゴリズムを開発することを目指している.ドメインに共通する不変なデータ構造を推定し抽出することで,適切なデータ解析を行うことができる.ここで問題となるのは「不変性」を適切に定義し,その特定,抽出を効率的に行うことである.R5年度は特に,適切な分布間距離に基づく不変構造の学習について研究を推進した.これまで培ってきた単ドメインにおける機械学習アルゴリズムを,不変構造を有する非一様な多ドメイン学習に適用するパラダイムについて,共同研究者らと議論し論文を出版した.さらに自己教師付き学習における表現学習と下流タスクとの関連についても理論的な性質を考察した.自己教師付き学習を用いると,多数のドメインの集合に共通する不変な表現と,個別のドメインにおいて重要な表現を切り分けることができる.これにより,実データを扱うための多ドメイン学習フレームワークを提供することが可能になる.この観点から研究を推進し,自己教師つき学習の理論的な性質を解明した論文を国際会議にて発表した.さらにこれまでの研究成果を実装し,広く応用に展開することが重要であることから,学習時には出現しなかったデータラベルに対処するための学習フレームワークであるオープンワールドの学習において,データセットシフト下で効果的に動作するアルゴリズムを開発し,国際会議に論文として受理された.以上のように,単ドメインにおけるロバスト学習,多様なデータドメインにおける不変な特徴量学習に関する研究,自己教師つき学習における表現学習の数理的研究などについて研究を推進し,成果を発表した.
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|