(A) 昨年に引き続き「多種類の有機遷移金属触媒反応を予測する」グラフニューラルネットワークを構築した。主に以下の2点を改良した。(1)触媒の配位子を約30種類に分類し、遷移金属+配位子を予測に用いた。(2)酸化的付加、還元的脱離に加えて、素反応に配位を含めた。その結果最高で97.7%の精度で生成物を予測できた。機械学習による化学反応予測は(遷移金属を含まない)純粋な有機反応の研究が殆どであり、またそのモデルは1000万個程度のパラメターを含む。他方、僅か数万個のパラメターを持つ我々のモデルは、より複雑(に見える)遷移金属触媒反応を高精度で予測できた。その理由は先行研究の多くがSMILESなどの線形表現で分子構造を表し、言語翻訳モデルを流用するという、化学者の理解とは程遠い不自然な方法だからと思われる。以上の結果を論文にまとめて出版した。 (B) 有機遷移金属触媒反応は、出発物が幾つかの素反応を行って生成物となるが、通常の実験ではこの最終生成物しか観測しない。我々のモデルは教師付き学習をするため、素反応のデータベースを人が作る必要があった。(A)で作成した高精度の反応予測器を用いて、出発物と生成物のみを与え、多段階の素反応も予測する研究を行った。(出発物、生成物)に対して「迷路」探索を強化学習で行った。weightの初期値を(A)から取り、actor-critic法を用いると素反応を正しく予測できた。またhindsight experience replayを用いると安定に強化学習できるようになった。以上の結果をまとめて学会で発表した。
|