研究課題/領域番号 |
20K19866
|
研究機関 | 統計数理研究所 |
研究代表者 |
劉 暢 統計数理研究所, ものづくりデータ科学研究センター, 特任助教 (30814149)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 物性予測 / モデルライブラリー / マテリアルズインフォマティクス / 転移学習 / ハイエントロピー合金 / 準結晶 |
研究実績の概要 |
本研究では,転移学習という機械学習の技術をマテリアルズインフォマティクス(MI)に導入し,材料データ量の少なさ問題(スモールデータの壁)の解消と外挿的物性予測の実現を図る.転移学習は,あるドメインで訓練されたモデルを他のドメインに適用するための機械学習技術で,訓練データが足りないタスクに対してよく使われる訓練手法である.例えば,大量の画像を用いて動物の種類を判定するニューラルネットワークモデルを訓練し,少数の花の画像データを用いて訓練済みモデルを改変して花の種類の分類器を再構築する.人間の学習で例えば,英語の経験がある人は,比較的にドイツ語を容易に学習できることに類似る.したがって,このような推論過程を模倣した転移学習にとって,いかなる方法でモデルのボリューム(経験の量)と多様性(経験の幅)を増加することが本幹になる.
本研究は,大量な訓練済みモデルを有するモデルライブラリー(XenonPy.MDL)の開発とそれを活用する仮想材料のスクリーニング・実験検証によって構成されている.XenonPy.MDLは本グループで推進しているMI専用オープンソースプロジェクトXenonPyの一部であり,世界最大の訓練済みモデルライブラリである.初年度のライブラリーシステムの開発をベースにして,今年度は開発してシステムを活用して,様々な課題に対して検証を進んでいる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
既に14万個のモデルを超える訓練ずみモデルライブラリーに対して,ほぼ予定通りで4万個ほどの新しいモデルを追加した.前年度と違い,今回の追加はモデルライブラリーの汎用性の増大ではなく,具体的な研究対象における応用に移行する.
今年度で挙げられる成果は2点ある: 1)ハイエントロピー合金(HEA)の熱力学安定性パラメーターの高精度な予測と相図作り.この研究の目的は東北大学陳迎教授のグループと連携して,機械学習による Fe-Ni-Co-Cr-Mn/Pd系HEAの計算相図予測である.この研究はまだ進行中であり,段階的成果は既に「2022 TMS Annual Meeting & Exhibition」でポスター発表した. 2)機械学習による準結晶の予測.この研究は新学術領域研究「ハイパーマテリアルのインフォマティクスとhidden orderの探索」(19H05820)の研究課題の一つである,本研究の手法では,既に発見が困難になった新規準結晶の探索を遥かに加速できることを示した.
|
今後の研究の推進方策 |
研究手法で述べたように,本研究の目的は保有するモデル数と具体的な課題に応用することである.初年度で作り上げたシステムを応用して,課題を持って実践的検証しに行くのは今後の目標である,既に述べたように,申請者が所属している統計数理研究所ものづくりデータ科学研究センターは,常時に10社以上の外部企業との共同開発を行なっている.初年度の開発作業により,コントリビュータとの連携に必要な環境等は概ね実装済みである以上,研究活動の拡大を円滑に開始できると予想している.
今年度(2021年度)を含め,来年度まで以下の課題を進んでいく予定がある:1)ハイエントロピー合金(HEA)の熱力学安定性パラメーターの高精度な予測と相図作り.2)特定な属性(例えば,半導体)を持つ準結晶の探索.3)結晶構造予測と新規結晶探索.4)JST-CREST(熱制御領域)「高分子の熱物性マテリアルズインフォマティクス」(代表:森川淳子(東工大))のチームとの連携と本グループが開発している高分子物性自動計算システムRadonPyと連携の自動検証方法も模索する.
|
次年度使用額が生じた理由 |
本研究の手法の一つは転移学習であり,材料開発における数多くの分野から訓練済みモデルを作り,データベース化する.従って,大量の訓練済みモデルと関連 データの保存及びオープンアクセスを維持するために,保存用NASサーバー或いはクラウドストレージ(AWS S3)を購入する.その他,成果の発信を目的とする論文掲載費用(オープンアク セス・チャージ等)と英文校正費も助成金を使用する予定である.
|