研究課題/領域番号 |
22H03645
|
配分区分 | 補助金 |
研究機関 | 京都大学 |
研究代表者 |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 機械学習 |
研究実績の概要 |
本研究では、現代社会のデータに急増している以下3つの特徴の組み合わせが存在する状況のデータを対象とする。 1) テンソル:従来の行列やグラフのみならず高次元のテンソル(ハイパーグラフを含む) が得ら れる。2) スパース性:現代社会で得られるテンソルのデータは、高次元で要素数は多いものの、実際には要素が埋まらないことが多くスパースであり、そのため低ランクである。3) 複数データ:モード(次元)を共有する複数のデータが得られる。例えば、ユーザの購買データのみならず、ユーザの情報やユーザ間の情報が得られ、ユーザというモードを共有する。 従って、これらの特徴を仮定し、「モードを共有する複数テンソルの内在構造をスパース性を考慮し効率的に解析する枠組み」の構築を行うことを目標とする。特に、できるだけ一般的な枠組みの構築を行うことが本研究の目的である。 今年度の成果の1つは、具体的に、MultiviewかつMultitaskの学習の下で、複数のスパースなテンソルを効率的に因子分解(Factorization)する手法を構築した。テンソルの分解は、主にCP分解とTucker分解に分けられるが、本手法では両者を組み合わせている。手法の特徴は、view間の相互作用を複数に分けて定式化することであり、また、これにより、効率的な推定アルゴリズムが構築できる。 この成果に加えて、個別化医療等の応用を意識した、テンソルを含む複数データを因子分解(factorization)する手法等を構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目標は、現代社会のデータに急増している3つの特徴;テンソル、スパース性、複数データの組み合わせを問題対象とし「モードを共有する複数テンソルの内在構造をスパース性を考慮し効率的に解析する枠組み」の構築を行うことであり、特に、なるたけ一般的な手法の構築を目指す。この目標に対して、今年度は、足掛かりとなるリーズナブルな手法を複数構築した。特に、成果の1つは、MultiviewかつMultitaskの学習における、効率的な因子分解手法であり、非常に一般的な問題設定である。今後、今までの研究で得た知見に基づき、なるたけ一般的な問題設定に対する手法を構築していくことが可能と考えている。
|
今後の研究の推進方策 |
現代社会のデータがしばしば共有する3つの特徴;テンソル、スパース性、複数データの組み合わせという3点を満たす、様々な問題設定において、特に、より一般的な問題設定において、問題解決手法を構築していく。これら様々な問題設定への解決手法から、それらを包含する、より一般的な枠組みを問題と解決手法に対して構築していく。
|