2020 Fiscal Year Annual Research Report
Discovery of innovative functional materials using state-of-the-art machine learning
Project/Area Number |
19H01132
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
吉田 亮 統計数理研究所, データ科学研究系, 教授 (70401263)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | マテリアルズインフォマティクス / 機械学習 / 分子設計 / 逆合成経路解析 / 転移学習 |
Outline of Annual Research Achievements |
所望の特性を有する新物質を探索する機械学習の手法を開発した.研究成果の概要は,以下の通りである. (1) 標的分子の合成経路を設計するベイズ推論のアルゴリズムを開発した.合成反応のデータベースを用いて,任意の反応物に対する生成物の予測モデルを構築する.次に条件付き確率のベイズ則に従い,この順方向のモデルを反転し,生成物から反応物の予測モデルを導く.最後に,逐次モンテカルロ法を適用し,市販化合物のリストから所望の生成物を導く反応物の組み合わせを探索する.本研究成果をGuo et al. J Chem Inf Model. 2020にて発表した. (2) 少数データに対するデータ科学の方法論の構築するために,転移学習の研究を実施した.具体的には,ベイズ推論のアイデアを導入し,特定のモデルに依存しない転移学習の一般的な方法論を構築した(Minami et al. AAAI. 2021).提案手法を特徴付ける二つのハイパーパラメータを選択することで,これまで独立に研究が進展してきた三つの既存手法(密度比推定,ベイズ更新,深層転移学習)を定式化できる.また,ハイパーパラメータを特定の値に設定することで,既存手法のハイブリッド型学習を実現できる.現在,提案手法を材料研究に投入し,実証研究を展開している. (3) 元素の特徴量から周期表を自動設計する教師なし学習のアルゴリズムを開発した(Kusaba et al. Sci Rep. 2021).多次元の元素データから規則性を発見し,二次元座標上の格子点に配置する.すなわち,高次元データの「テーブル」形式の次元削減に問題を帰着させた上で.独自の教師なし学習の方法論を構築した.実データに提案手法を適用し,標準的な周期表を概ね再現できることを実証した.さらに,現在の最新の元素データに提案手法を適用し,3次元円錐螺旋型の周期表を構築した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
分子設計の機械学習アルゴリズムについては,方法論の数理的基盤,アルゴリズムの設計,実装が概ね完了した.実験やシミュレーションから得られた化学構造と特性のデータを用いて,教師あり学習で化学構造から特性の予測モデルを構築する.これに条件付き確率のベイズ則を適用し,特性から構造の逆方向のモデルを導く.既存化合物のパターンを学習させた確率言語モデルを用いてモンテカルロ計算を行い,逆方向のモデルから仮説構造を発生させ,所望の特性を有する埋蔵分子を発掘する.本グループが開発しているオープンソースソフトウェアXenonPyに提案手法を実装した.現在はハンズオンセミナーの開催やYouTubeでの動画配信などを通じて,ユーザーの拡大を図っている.
また,今年度は提案された候補分子の合成経路を設計する手法も開発した.米国特許化合物の反応データセットを用いて包括的な数値実験を実施し,既知の経路に対する予測性能や提案された経路の化学的妥当性を検証した.その結果,1ステップの反応経路の予測では80.3%,2ステップの反応経路では50.0%の精度で既存の合成経路を予測できることが分かった.また,予測された新規の反応経路に対し,有機合成の知見に基づき候補経路の合成可能性を評価した.その結果,約35-60%の候補が化学的に実現可能であるという結論に至った.
さらに,これらの手法を用いて実証研究を展開している.特に,高分子熱物性の実証研究では,従来の高分子に比べて約80%の高い熱伝導率を有する新しい高分子を発見すること成功している(Wu et al. npj Comput Mater. 2019).今後も様々な材料系に提案手法を適用していき,実証フェーズを加速していく.
|
Strategy for Future Research Activity |
今後は以下の外部プロジェクトと連携しながら,実証フェーズを加速していきたい.提案手法を材料研究に展開し,理論と実践をフィードバックさせる形で研究を進める.
(1) 本センターの研究グループは,2019年に始動したJST-CREST熱制御領域「高分子の熱物性マテリアルズインフォマティクス」(代表:東京工業大学 森川淳子教授)に参画している.提案手法を本プロジェクトに投入し,高分子の熱動態の理解と高い熱伝導性を有する新材料の発見を実現する. (2) 本センターのグループは,2019年に始動した科研費新学術領域「ハイパーマテリアル:補空間が創る新物質科学」(領域代表:東京理科大学 田村隆治 教授)に参画している.準結晶は通常の周期結晶のような並進対称性を持たないが,原子配列に高度な秩序がある物質群である.最初の準結晶の発見からおよそ35年間で100種類以上の準結晶が見つかっている.準結晶の発見は新しい固体構造の概念を確立された.しかしながら,近年は準結晶の発見のペースが著しく鈍化している.我々は,機械学習の先進技術(XenonPyに実装)を駆使して,新しい準結晶の発見を加速し,準結晶の形成メカニズムの理解を促進する. (3) 本グループが開発しているオープンソースソフトウェアXenonPyは,様々な材料研究に活用できる汎用ツールである.現在は国内外の多くのユーザーが本ソフトウェアを利用して材料研究を展開している.例えば,統計数理研究所ものづくりデータ科学研究センター(センター長:吉田)は多数の企業との共同研究を推進しており,有機・無機・複合材料を含む幅広い分野でXenonPyを活用した材料開発を推進している.これらの研究体制を実証フェーズの1チャンネルに位置付け,本プロジェクトを推進していく.
|
Research Products
(29 results)