Project/Area Number |
23K24901
|
Project/Area Number (Other) |
22H03645 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Kyoto University |
Principal Investigator |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000)
Fiscal Year 2024: ¥5,850,000 (Direct Cost: ¥4,500,000、Indirect Cost: ¥1,350,000)
Fiscal Year 2023: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Fiscal Year 2022: ¥5,070,000 (Direct Cost: ¥3,900,000、Indirect Cost: ¥1,170,000)
|
Keywords | 機械学習 |
Outline of Research at the Start |
上記、研究の目的に記載した、現代データに共通する3つの特徴の組み合わせを問題対象とする。このようなデータに対し、本研究では、「モードを共有する複数テンソルの内在構造をスパース性を考慮し効率的に解析する一般的枠組み」の構築を行う。具体的には、スパース性を考慮した複数テンソルのノルム、及びノルムの効率的学習手法構築と理論解析から、上記枠組みの普遍的理解を目指す。テンソルは一般的データ形式で、本研究は機械学習の進展ひいては社会の発展に資する。
|
Outline of Annual Research Achievements |
本研究では、現代社会のデータに急増している以下3つの特徴の組み合わせが存在する状況のデータを対象とする。 1) テンソル:従来の行列やグラフのみならず高次元のテンソル(ハイパーグラフを含む) が得ら れる。2) スパース性:現代社会で得られるテンソルのデータは、高次元で要素数は多いものの、実際には要素が埋まらないことが多くスパースであり、そのため低ランクである。3) 複数データ:モード(次元)を共有する複数のデータが得られる。例えば、ユーザの購買データのみならず、ユーザの情報やユーザ間の情報が得られ、ユーザというモードを共有する。 従って、これらの特徴を仮定し、「モードを共有する複数テンソルの内在構造をスパース性を考慮し効率的に解析する枠組み」の構築を行うことを目標とする。特に、できるだけ一般的な枠組みの構築を行うことが本研究の目的である。 今年度の成果の1つは、具体的に、MultiviewかつMultitaskの学習の下で、複数のスパースなテンソルを効率的に因子分解(Factorization)する手法を構築した。テンソルの分解は、主にCP分解とTucker分解に分けられるが、本手法では両者を組み合わせている。手法の特徴は、view間の相互作用を複数に分けて定式化することであり、また、これにより、効率的な推定アルゴリズムが構築できる。 この成果に加えて、個別化医療等の応用を意識した、テンソルを含む複数データを因子分解(factorization)する手法等を構築した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目標は、現代社会のデータに急増している3つの特徴;テンソル、スパース性、複数データの組み合わせを問題対象とし「モードを共有する複数テンソルの内在構造をスパース性を考慮し効率的に解析する枠組み」の構築を行うことであり、特に、なるたけ一般的な手法の構築を目指す。この目標に対して、今年度は、足掛かりとなるリーズナブルな手法を複数構築した。特に、成果の1つは、MultiviewかつMultitaskの学習における、効率的な因子分解手法であり、非常に一般的な問題設定である。今後、今までの研究で得た知見に基づき、なるたけ一般的な問題設定に対する手法を構築していくことが可能と考えている。
|
Strategy for Future Research Activity |
現代社会のデータがしばしば共有する3つの特徴;テンソル、スパース性、複数データの組み合わせという3点を満たす、様々な問題設定において、特に、より一般的な問題設定において、問題解決手法を構築していく。これら様々な問題設定への解決手法から、それらを包含する、より一般的な枠組みを問題と解決手法に対して構築していく。
|