研究課題
本研究では、グラフの表現学習に「転移性」「構成性」を実現するための技術研究を行う。グラフ表現学習は近年GNNを用いた多くの研究報告があるものの、先行成功例である画像や言語のような実用性は未達のままである。本研究では、現行GNNの畳み込み操作を廃し、グラフ同様に非定型入力の言語タスクで有効な多層Transformerの自己教師あり学習による「転移性」の獲得を目指す。同時に、分子の「構成性」を反映できる深いモデル構造と自己教師あり事前学習タスクの設計を行う。応募申請時から日進月歩で技術的な進展が報告されるトピックであり、本年度も事前学習やGNNの自己教師あり学習(SSL)について、さまざまな関係知見が発表され、また我々の検証でも具体的な知見が得られた。特に、応募申請時にはまだ未成熟な問題であったGNNとTransformerとの類似性について同時多発的に興味深い報告がなされた。TransformerのEncoder部分はComputer Vision領域でもViTとして非常に注目される技術となったが、構造としては与えられた複数の多次元特徴ベクトルを処理する汎用モジュールと見ることができる。実際、本年度は触媒活性の計算データOC20等を用いてTransformer Encoderの検証を行った。GNNに関しては初年度計画に沿って行った既存の知見を分析検討した知見を、招待講演や総説などとして多数報告することができた。また、従来、GNNではない標準的な機械学習で行ってきた触媒データの機械学習について、GNNとTransfomerを組み合わせたモデルの検証を行った。また分子生成タスクでのGNNに関しても探索問題として再定義することで分子グラフの自動補完を行う新たな枠組みを提案し国際ワークショップで発表を行った。
2: おおむね順調に進展している
初年度は既存の事前学習手法であるGROVERおよび多層GNN事前学習の分析と要素技術検討を行った。 GNNに関わる技術進展は非常に早く本年度も多数の関係する知見が機械学習コミュニティで発表・検証された。応募申請時には公開されていなかったGROVERに関しても採択論文の予告通り、githubにpytorch実装が公開され、またそれを比較に用いた論文もいくつか発表された。本年度はこれらの調査と解析および、こちらも進展が著しいグラフを入力とするTransformerやTransformer型のGNNについても調査や手法検証を行った。GNNの事前学習については自己教師あり学習が要と考えられており、自然言語処理を追って様々なSSLの事前学習タスクが提案されており調査と検証を行った。
初年度に得られた分子に関わるGNNについて国際誌の依頼サーベイ論文を執筆中でありこの完成投稿を行う。また計画にそって、初年度の調査・検討で得られた知見やTransformerやGNNについての実装検証で得られた知見をもとに「転移性」「構成性」をさらに検証する具体的なモデルの検討を進める。Transformerに分子構造(特にグラフとみたときのトポロジ)を殿程度・どのように反映するか、3D構造が関与するタスクでのGeometric GNNにTransformerをどのように融合できるか、を中心に検討を行う。
元々予定してた学会出張は新型コロナの影響で本年度もオンライン開催となったため、出張費で計上していた予算は次年度に繰り越すこととした。本年度も感染症の影響の様子をみながら出張費として支出する予定である。
すべて 2022 2021
すべて 雑誌論文 (7件) (うち査読あり 6件) 学会発表 (15件) (うち招待講演 10件)
Chemistry Letters
巻: 51 ページ: 269-273
10.1246/cl.210645
The AAAI'22 Workshop on Deep Learning on Graphs: Methods and Applications (DLG-AAAI'22), Vancouver, BC, Canada
巻: - ページ: -
Microscopy and Microanalysis
巻: 28 ページ: 138-144
10.1017/S1431927621013799
Frontiers in chemistry
巻: 10 ページ: 818230
10.3389/fchem.2022.818230
情報処理学会研究報告
巻: AL-187 ページ: 1-8
化学と教育
巻: 70 ページ: 122-125
ChemCatChem
巻: 13 ページ: 3636-3655
10.1002/cctc.202100495