研究課題/領域番号 |
19K15275
|
研究機関 | 東京工業大学 |
研究代表者 |
高橋 亮 東京工業大学, 科学技術創成研究院, 助教 (80822311)
|
研究期間 (年度) |
2019-04-01 – 2021-03-31
|
キーワード | 能動学習 / 機械学習 / 第一原理計算 / データベース |
研究実績の概要 |
近年、大規模材料データベースと機械学習の手法を組み合わせて新しい知見を得る、Materials informaticsの研究が盛んに行われている。しかしながら、既存のデータベースを用いると、第一原理計算の精度の問題と、データベースが主に既報の材料を対象としていることに起因する構成元素や構造などのデータの偏りの問題が生じる。本研究課題では、第一原理計算の自動化プログラムを構築し、必要十分な計算コストの元に適切な計算条件で各物性値を計算し、また能動学習の手法を用いてデータベースの偏りを無くすように、データベースの増強を行う。 本年度では、自動計算プログラムとそれを用いたデータベースの開発と、能動学習の手法の検討を行った。主な成果として、(1)1000を超える酸化物について、第一原理計算により構造・バンドギャップ・電子系・格子系の誘電率を計算し、MongoDBを用いてそれらの物性値の高精度なデータベースを構築した。また、ランダムフォレスト法により、誘電率の予測モデルと、それらの制御因子の特定を行った。(2)能動学習の手法の検討を行うため、Materials Projectのデータを2つに分け、一方を既知データ、他方を未知データと仮定し、Uncertainty Sampling法を適用した。既知データからだけでは未知データを高精度に予測できないが、Uncertainty Sampling法を用いて未知データからごく少数のデータを既知データに追加すると、その他の多数の未知データの予測精度も著しく向上することが分かった。(3)能動学習を材料探索に応用することを検討するため、特定のバンドギャップを持つ物質を探索するための評価関数を設計し、Materials projectのデータを用いてベイズ最適化を行ったところ、対象の化合物が効率的に探索できることが分かった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の基盤となる、データベース構築用のプログラムが、実用的に利用できるレベルまで開発が進んだ。また、能動学習の手法やプログラムについても既存データベースを用いて検討を行い、材料探索を効率化する効果があることが実証できた。
|
今後の研究の推進方策 |
得られた知見をもとに、更にデータベース構築や能動学習を用いた自動探索プログラムの開発を進める。また、探索対象の候補とする構造の中には、安定相や競合相に対して熱力学的に不安定であり、明らかに現実的に存在することができない様な物質が数多く作成されてしまうため、その様な物質を除外してより効率的に材料探索を行うための手法の検討を行う。
|
次年度使用額が生じた理由 |
本年度は酸化物のデータベースを中心に大量の自動計算を行ってきたが、当初の想定よりも計算時間が短く、比較的少ない計算資源でデータベースを構築することができることが分かった。その一方で、物質の電子状態をデータとして保存する際に想定外に大容量のストレージを必要とすることや、一部の物質がメモリの不足によって計算ができないことがわかった。そのため、データストレージやメモリの性能に重点を置くことを視野に入れ、研究の進捗状況を考慮しながら次年度に購入する計算機を慎重に吟味することとした。
|