2022 Fiscal Year Research-status Report
Heterogeneous metric learning に基づく結晶構造予測
Project/Area Number |
22K21292
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
草場 穫 統計数理研究所, ものづくりデータ科学研究センター, 特任研究員 (50965803)
|
Project Period (FY) |
2022-08-31 – 2024-03-31
|
Keywords | 結晶構造予測 / Heterogeneous距離学習 / 元素置換 / マテリアルズインフォマティクス / 計算による新規材料発見 |
Outline of Annual Research Achievements |
本研究は、heterogeneous metric learningに基づいたテンプレートベースの新たな結晶構造予測手法の提案を目的としている。本手法では、与えられた化学組成と結晶構造のペアが安定構造であるか否かを判別する関数を結晶構造データベースから学習し、その関数の評価値に基づいたテンプレート構造の提案によって構造予測を行う。本研究は研究者自身による先行研究 [1] の直接的な発展手法である。この先行研究は、homogeneous metric learning に基づいたテンプレートベースの結晶構造予測手法であり、申請書を作成した段階では未採択であったが当該年度8月に公式に雑誌からpublishされた [1]。 当該年度では、化学組成と結晶構造のペアが安定構造であるか否かを判別する関数の推定のために、既存のheterogeneous metric learning手法の調査、数値実験による比較を行った。その結果、9割を超える精度で判別可能な予測モデルの獲得に成功した。また、化学組成等の情報をできるだけ情報損失が少なく記述子 (=固定長ベクトル) に変換する一般的な枠組みとしてカーネル平均記述子を開発した。本手法のコードは既に公開している [2]。本記述子の使用による予測精度の改善は複数の機械学習例で確認されている。
[1] Kusaba, M., Liu, C., & Yoshida, R. (2022). Crystal structure prediction with machine learning-based element substitution. Computational Materials Science, 211, 111496. [2] https://github.com/Minoru938/KmdPlus
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究実績の概要に記載したように、「与えられた化学組成と結晶構造のペアが安定構造であるか否かを判別する関数の推定」に関してはおおむね完了し、9割を超える精度で判別可能な予測モデルの獲得に成功している。しかし、本結晶構造予測手法の枠組みにおける現実的な予測モデルの評価手法として、現在のものが最良では無いと気づいたため、別の評価手法によるモデルの評価を行なっている (具体的に言うと、組成比クラスに対するmean average presition)。これと関連して、バイアスに対処した新たな訓練データの選択とそれらによるモデル訓練作業を行なっている。この作業はまだ完全に完了していないが最終段階にあると言える。 また、訓練済みモデルによってスクリーニングされたテンプレート構造を元に結晶構造予測する部分は、研究者自身による先行研究 (Kusaba et al. 2022) の手続きをそのまま適用すれば達成可能ではあるが、以前の元素置き換えによる結晶構造生成プログラムの改良に取り組んでいる。具体的に言うと、以前の手法では完全にクエリ組成の組成比とテンプレート構造の組成比が一致している必要があったが、組成比の整数の結合によりクエリ組成の組成比と一致する全てのテンプレート構造を対象にできるようにプログラムの改良を進めている (進行中)。このプログラムが完了すれば、実質的に本結晶構造予測手法が完成するので、実例における本手法の精度検証、比較、結果の考察に進むことができる。 当該年度は他の研究、業務に多くの労力を割いたため、進捗はやや遅れているが、本質的に研究上の問題がある訳では無いので、今年度、より本研究課題に集中することで計画通りに研究を進めることができると考えている。
|
Strategy for Future Research Activity |
「現在までの進捗状況」に記載したように、「与えられた化学組成と結晶構造のペアが安定構造であるか否かを判別する関数の推定」を組成比クラスのバイアスに対処した訓練データとモデル評価法に基づいて完了させ、最終的な機械学習モデルを獲得する。また、組成比の整数の結合によりクエリ組成の組成比と一致する全てのテンプレート構造を対象にできる結晶構造予測プログラムを完成させる。この2つのタスクが終了すると、実質的に本結晶構造予測手法が完成するので、実例における本手法の精度検証、比較、結果の考察に進む。その後本手法の論文化とコードの公開を行う。 交付申請書の研究計画では、「データベースに無いテンプレート構造の提案手法開発」を実施する予定と書いたが、これは既存研究がある上に、基本的に本手法の数値実験ではデータベース中のテンプレート構造を使った結晶構造予測のみを行う予定なので実施しないことにした。構造と組成を heterogeneous に取り扱うという本手法の特性上、自身の先行研究を含む既存のテンプレートベース結晶構造予測手法と比べて、より広いテンプレート構造候補を使った予測が可能になるため、データベース中のテンプレート構造のみを使った結晶構造予測でも十分本手法のアドバンテージが示せると考えている。また本手法が、構造から組成を探す逆向きの予測に対応していると言う点が、テンプレートベースに限らない一般の結晶構造予測手法と比べても、ユニークであることに気づいたので、当初の研究計画よりも、より「構造から組成の予測 (安定するペアの探索)」にフォーカスした本手法の精度検証、比較、結果の考察を行う予定である。
|
Causes of Carryover |
購入した計算機 (16インチMacBook Pro) の価格が、物価変動、為替変動のため申請書作成段階の価格と変化したため次年度使用額が生じた。比較的少額であるため、当初の予定通り次年度使用する予定である。
|