Project/Area Number |
22K14747
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 35030:Organic functional materials-related
|
Research Institution | Waseda University |
Principal Investigator |
谷口 卓也 早稲田大学, データ科学センター, 准教授(任期付) (20843907)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2023: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2022: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | マテリアルズインフォマティクス / 有機固体 / グラフニューラルネットワーク / 深層学習 / 材料科学 |
Outline of Research at the Start |
有機固体は多様な発光挙動や力学特性を発現する材料群であるが、マテリアルズインフォマティクス(MI)の研究は進展していない。本研究は有機固体のMI基盤の確立を目指し、そのために結晶構造と物性値が対応づいた有機固体データベースを構築し、機械学習へのデータ入力形式や予測モデルの比較検討により、有機固体に有用なMIアルゴリズムを開発する。
|
Outline of Annual Research Achievements |
有機固体は発光特性や半導体特性、力学特性など多様な機能性をもつ材料群であるが、物性と構造が紐づいたデータベースは非常に限られており、有機固体を対象にしたマテリアルズインフォマティクス(MI)は困難であった。また、有機固体材料における機械学習の活用は無機材料ほど進んでおらず、機械学習の活用と検証を進めていくことが重要である。 OMDBのデータセットを用いてバンドギャップの回帰において分子グラフと結晶グラフの数理表現を比較した。その結果、結晶グラフの方が予測精度が高いことを見出した。また、2つのグラフ表現の比較から、分子構造がバンドギャップに与える影響と分子間相互作用がバンドギャップに与える影響を定量的に評価できた(T. Taniguchi et al., ACS Omega, 2023)。次に、構造相転移データについては学術論文から分子構造、結晶構造、転移温度・エンタルピーをまとめることでデータセットを構築した。構造相転移では分類問題として扱い、Positive-Unlabeled学習を行った。これによりUnlabeledデータセットの中に含まれるPositiveの可能性が高い分子を抽出することができ、文献および実験により本スクリーニングが有効であることを見出した(D. Takagi et al., Digital Discovery, 2023)。さらに、有機固体の弾性率予測における汎用機械学習ポテンシャルの有効性を検証した。Matlantisで提供されているPFPが他の汎用ポテンシャル(CHGNet)よりも精度がよく、DFT計算に匹敵する予測精度であることが明らかになった(T. Taniguchi, CrystEngComm, 2024)。また、得られた研究成果は学術論文だけでなく、日本結晶学会や日本化学会春季年会などでも学会発表している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題において複数の学術論文を発表できている。OMDBのデータセットを用いてバンドギャップの回帰において分子グラフと結晶グラフの数理表現を比較した結果、結晶グラフの方が予測精度が高いことを見出した。また、2つのグラフ表現の比較から、分子構造がバンドギャップに与える影響と分子間相互作用がバンドギャップに与える影響を定量的に評価できた(T. Taniguchi et al., ACS Omega, 2023)。次に、構造相転移データについては学術論文から分子構造、結晶構造、転移温度・エンタルピーをまとめることでデータセットを構築した。構造相転移では分類問題として扱い、Positive-Unlabeled学習を行った。これによりUnlabeledデータセットの中に含まれるPositiveの可能性が高い分子を抽出することができ、文献および実験により本スクリーニングが有効であることを見出した(D. Takagi et al., Digital Discovery, 2023)。さらに、有機固体の弾性率予測における汎用機械学習ポテンシャルの有効性を検証した。Matlantisで提供されているPFPが他の汎用ポテンシャルCHGNetよりも精度がよく、DFT計算に匹敵する予測精度であることが明らかになった(T. Taniguchi, CrystEngComm, 2024)。 その他にも、分子構造が似た2つの化合物のキラル結晶とラセミ結晶の構造類似度を調べ、ヤング率と構造の関係を明らかにした(K. Ishizaki et al., Cryst. Growth. Des., 2023)。また、有機無機ペロブスカイト太陽電池に機械学習を適用した分析を行い論文発表した(R. Fukasawa et al, Energy Advances, 2024)。
|
Strategy for Future Research Activity |
結晶構造をバーチャルスクリーニングするためには結晶構造予測が必要であり、CrySPYなどの構造探索パッケージを活用することで、結晶構造予測ができるように実装する。また、ChatGPTに代表されるような大規模言語モデル(LLM)のPython APIを使うことで、文献から構造化データの自動抽出、プロセス条件を考慮したデータセット構築、機械学習モデルの構築についても検討する。 また、より高速に機械学習ポテンシャルを利用できるようにするため、機械学習ポテンシャルのモデル構造や学習方法の工夫を行う。例えば、教師モデルの知識を生徒モデルに転移する知識蒸留法は、他の分野で軽量なモデルを効率的に構築する手法として報告されているため、有機固体の知識を軽量なモデルに転移できるか検証する。
|