Project/Area Number |
23K21142
|
Project/Area Number (Other) |
21H02017 (2021-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2021-2023) |
Section | 一般 |
Review Section |
Basic Section 35030:Organic functional materials-related
|
Research Institution | Institute of Science Tokyo (2023-2024) Waseda University (2021-2022) |
Principal Investigator |
畠山 歓 東京工業大学, 物質理工学院, 助教 (90822461)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,680,000 (Direct Cost: ¥13,600,000、Indirect Cost: ¥4,080,000)
Fiscal Year 2024: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2021: ¥8,710,000 (Direct Cost: ¥6,700,000、Indirect Cost: ¥2,010,000)
|
Keywords | マテリアルズ・インフォマティクス / 高分子 / 深層学習 / ディープラーニング / 高分子材料 / ケモインフォマティクス / 有機材料 / 機械学習 / 機能性高分子 / マテリアルズインフォマティクス / 有機機能材料 |
Outline of Research at the Start |
本研究では、材料科学と深層学習の学理を融合し、優れた有機材料を自動で探索するシステムの枠組みを探求する。最近注目を集める大規模言語モデルや化学に特化した深層学習モデルを活用し、少ないデータでも効果的に学習できるシステムを実現する。このような取り組みを通して、実験研究者の暗黙知をデータ化する。一連の取り組みを通して、信頼できる物性予測モデルを開発し、優れた有機機能性材料の創出を目指す。
|
Outline of Annual Research Achievements |
当該年度は、効率的に革新有機材料を探索する深層学習システムの構築に向け、当初の計画を超えて、大規模言語モデルを活用した新たな取り組みに注力した。従来のマテリアルズ・インフォマティクス(MI)では、実験データの不足や計算量の爆発といった課題が指摘されていた。本研究では、これらの問題を解決すべく、明示的な教師データを必要としない深層学習モデルの構築、実験者の暗黙知を取り込んだ物性予測、量子マシンによる候補分子の探索など、新たな方法論の開発に取り組んだ。 具体的には、Generative Pretrained Transformer 4(GPT-4)などを活用しながら、最適な実験条件の探索や提案、記述子の選択、ロボット実験の予備検討などに大規模言語モデルを応用し、その有効性を検証した。大規模言語モデルを用いることで、膨大な文献データから材料科学に関する知識を効率的に抽出し、実験条件の最適化や記述子の選択に活用できることが判明しつつある。プロンプトチューニングや継続学習などの手法を活用することで、実験者の経験則をモデルに反映させられる可能性も明らかになりつつあり、これにより、予測精度の向上が期待できることが分かった。さらに、量子コンピューティング技術を組み合わせることで、候補分子の探索を加速できる可能性が示唆された。 以上の取り組みを通じて、実験化学と機械学習、量子計算を融合した材料開発の学理構築に向けて、基礎的な知見を集積できた。一連の成果は、学術論文や国内外の学会で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画では、グラフニューラルネットワークのような既存手法を用いて研究を進める予定であったが、2023年度ごろから、パラメータ数が100億を大幅に超える大型の言語モデルが出現したことで、計画が大きく進展した。 具体的には、GPT-4やClaude、Llamaなどの大規模言語モデルを活用し、材料科学分野における新たな方法論の開発検討に取り組むことができた。これにより、従来のマテリアルズ・インフォマティクス(MI)で問題となっていた、膨大な文献データから材料科学に関する知識を効率的に抽出する手法でブレイクスルーが生まれつつあり、実験条件の最適化や記述子の選択に応用できることが明らかになってきた。
|
Strategy for Future Research Activity |
今後の研究推進においては、化学分野に特化した大規模言語モデルの構築検討や活用を進めていく。現在の汎用的な言語モデルを基盤としつつ、化学反応や物性、合成条件などに関する専門知識を取り込んだモデルの開発可能性を検証しながら、材料探索の効率化や精度向上を図る。 また、自動実験のための言語モデルの活用にも新たに注力する。具体的には、反応モニタリング装置やロボットアームの制御に言語モデルを組み込むことで、実験の自動化と最適化を推進する。言語モデルを用いて実験条件を自動的に調整し、目的の物性を持つ材料を効率的に合成するシステムの構築を目指す。システムは材料合成の実験へ実際に導入し、その有効性を検証する。
|