研究課題/領域番号 |
21K12027
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 名古屋大学 |
研究代表者 |
安田 耕二 名古屋大学, 未来材料・システム研究所, 准教授 (70293686)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2023年度: 130千円 (直接経費: 100千円、間接経費: 30千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 機械学習 / 化学情報学 / 反応予測 / 有機遷移金属 / 化学反応 / 量子化学 |
研究開始時の研究の概要 |
この研究は、既知の有機遷移金属反応を特別なニューラルネットに学習させて、新規反応をひらめかせたり、良い遷移金属触媒を発見することを目指します。そのために、遷移金属を含む分子構造をはっきり認識する、グラフニューラルネットを開発します。また、有機遷移金属の反応を実験論文などから収集し、データベースを構築します。ニューラルネットに反応パターンを学習させ、新しい反応を予想します。これを量子化学計算でシュレーディンガー方程式を解き検証します。人工知能でこの手続きを自律的、大規模かつ徹底的に行い、実験化学者の知能を超える事を目指します。
|
研究実績の概要 |
グラフニューラルネットワークを用いて遷移金属触媒反応を予測する研究は、おおむね順調に進み、95%以上の精度で反応を予測できた。素反応を学習対象に選んだこと、化学的に意味のあるネットワーク構造を選んだことが良かったと理解している。この結果を日本コンピュータ化学会秋季年会で発表した。また同学会の論文誌に投稿し、acceptされた。 金属により官能基や反応場所に好みがあるが、それが予測結果に正しく反映されていた。ニューラルネットが見つけた潜在表現は、適切な主成分分析で理解できるものだった。反応式中での役割に応じて部分構造がクラスター化されるようだった。他方directing groupや特別な配位子が重要なC-H活性化反応の予測精度は、他より低くなった。 既存の研究は、鈴木反応やHeck反応など個々の反応に焦点を絞り、詳細な条件を機械学習している。それに対し本研究では、既知の反応を幅広くカバーし、他方詳細な反応条件は反映しておらず、相補的と言える。 また化学反応の機械学習では、実験で得られたデータを一般に用いるため、入手やコストに問題がある。将来は、量子化学計算で反応データを追加するようになると思われるが、その際には素反応が学習単位となる。我々が実験データから作成した素反応データベースは、その出発点になり得る。更に、量子化学計算で反応データを自動生成するには、出発物の反応しそうな場所を選ぶ必要がある。我々の機械学習モデルは、このようなデータの自動生成にも適していると思われる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
素反応のモデルとしてデータセットを表現できる最も単純なものを選び、当初研究を進めた。その結果は予測精度という点では満足できるものだったが、実験化学者から「モデルが単純すぎる」との批判を受けた。素反応は反応の中間表現だと考えるとこれで構わないという意見もあるが、機械学習の説明可能性の点では、実験化学者にも理解できるものがふさわしい。そこで次に重要な配位も素反応に加えて、研究をやり直した。 実際に実験をして予測を検証すること、Reaxysなど追加のデータセットを用いること、学習モデルを多数の実験化学者と競わせるテストを提案するアドバイスもあった。残念ながらこれらは予算で賄いきれない。
|
今後の研究の推進方策 |
残り一年となった現時点で最重要なのは、博士課程の学生に論文を書く指導をすることと、機械学習モデルを強化学習と組み合わせることである。後者については、価値関数や行動価値関数が安定に推測できないようだが、その原因がまだ分からない。最も簡単なモデルと学習方法でデバッグする必要がある。
|