無機結晶データベースや自作のデータベースに機械学習の一つである推薦システムを応用することで,合成可能な新規無機化合物を効率的に発見する方法を提案した.その結果,多くの化学組成の中から,無機化合物が存在する組成を予測することができ,新規無機化合物の発見を大幅に加速させることができた. 具体的には,組成データを適切に行列化する必要があるため,様々な行列化方法について検討した.行列化された組成データに化学組成記述子を導入し,推薦システムを構築した.得られた推薦システムをもとに多くの化学組成に対する予測を行い,新規化合物の合成可能性が高いと予想される化学組成,条件を列挙した.その後,推薦システムにおいて最も重要である未知データに対する予測性能の検証を行った.化学組成の事前知識として,化学組成の元素情報から導出される化学組成記述子を導入し,予測性能の向上を目指した.このような化学組成記述子は,化合物の凝集エネルギーなどの物性値を高精度に予測できることが分かっており,推薦システムにおいても有効であった.また,単純な推薦システムの方法で使われている化学組成表現も有効であったため,それらと化学組成記述子を組み合わせることができるFactorization machineなどの推薦システムの方法を採用した. 無機化合物データベースに含まれる化合物数は,考えうる化学組成と比べると圧倒的に少なく,本研究のアプローチは,多く残っているはずである未知の無機化合物の発見を大幅に加速させるものであり,無機化学や結晶化学の学術に貢献できると考えている.
|