2020 Fiscal Year Research-status Report
データ駆動科学における量子物理・化学的に解釈可能な深層学習手法の開発とその検証
Project/Area Number |
20K19876
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
椿 真史 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (80803874)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 機械学習 / 量子化学計算 / 深層学習 / 密度汎関数法 / データ駆動科学 / マテリアルズ・インフォマティクス |
Outline of Annual Research Achievements |
初年度の研究実績としてはまず、論文が2本採択された。ひとつは物理学の国際誌Physical Review Letters、もうひとつは機械学習の国際会議NeurIPSである。どちらも当該分野における最上位の国際誌・国際会議であり、所内のプレスリリースやメディアにも掲載された。 研究内容としては、材料科学やマテリアルズ・インフォマティクスのための機械学習技術であり、大枠となるフレームワークを完成させた。今後の拡張性も高く、物理だけではなく化学における様々な材料(触媒や高分子など)にも幅広く応用できるコア技術となっており、日本化学会での招待講演も行った。 具体的な技術としては、化合物の物性を学習・予測する深層学習手法である。特に重要な点は、物理学、量子化学、特に密度汎関数法に基づく学習モデルを考案・設計したところである。例えば、波動関数の重ね合わせにおける線形性や、電子密度とポテンシャルの対応などを適切にモデルに組み込んだ。このように物理に基づくことでモデルのブラックボックス性を解消し、解釈性が向上する。さらに、機械学習が不得意とする予測における外挿性を高めることにも成功した。解釈性と外挿性は、近年指摘されている機械学習の大きな課題であり、特に材料科学やマテリアルズ・インフォマティクスではこの解釈性と外挿性が予測精度以上に重要であることから、これに対する一つの解決策を提示できたことは大きいと考える。 このような特徴を持つ技術であることから、学習モデルの再利用性と汎用性は高く、様々な物質・材料データへの横展開も比較的容易に行うことができる。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画以上に進展していると判断する理由として、当該分野における最上位の国際誌・国際会議に論文が採択されただけでなく、想定していた以上に、開発した技術が高い拡張性を持つことが検証を通じてわかってきたからである。特に、適切に物理の知識を機械学習モデルに組み込むアプローチが成功したことで、低分子有機化合物以外の他の材料データにおいても同様のアプローチを検証していく価値は大いにある。 またこの研究の副産物として、材料科学やマテリアルズ・インフォマティクスにおいて汎用的に使うことができる記述子も得られることがわかった。記述子とは、物質データに対する数値表現(機械学習で言うところの特徴量)であり、材料科学やマテリアルズ・インフォマティクスにおいては、どのような記述子を使うかが中心的な課題となる。開発した機械学習モデルは一度学習してしまえば、物理に基づくことから高い再利用性と汎用性を持つことから、性質の良い記述子を提供でき、様々な応用先の開拓を行うことができると考えている。
|
Strategy for Future Research Activity |
今後の研究の推進としては、大きくわけて二つの方策がある。一つは、機械学習モデル自体の改善・改良であり、もう一つは様々な材料への応用先を考えることである。 開発した機械学習モデルは主に深層学習を用いているが、重要な点はモデル全体が物理学に基づいていることである。そのため、モデルの改善のアプローチは、深層学習モデル自体の改善というよりもむしろ、物理学の視点から基づくものであるべきであり、その方針が定まりやすい。具体的には、波動関数の角度依存部分・方向性を適切に考慮すること、重元素において考慮すべき波動関数の変更などを、モデルに組み込むことで改善できる。これは、試行錯誤やアドホックな技術の追加を要する機械学習モデルの改善とは違い、物理的に必然的に備えなければならない要素である。 また、このような改善を行うことで、応用先も格段に広がる。特に、より適切な波動関数を用いることで計算量を減らしつつ、重元素を多量に含んだ化合物を学習することができれば、触媒化学、高分子化学、創薬などへの応用も可能となってくる。また、金属を含む固体物理への応用も視野に入ってくる。
|
Causes of Carryover |
コロナの影響で、論文が採択された国際会議での発表や、国内学会の招待講演での発表、大学などでの研究滞在、所内の海外留学制度などの予定がすべてなくなったため、それらに使用する予定の予算が大量に余ってしまった。少なくとも今後数年は同様の状況が続くと見込まれるため、予算の配分計画を大幅に変更しなければならない。
例えば、学生などを積極的にリサーチ・アシスタントとして雇用するなどの計画を進めている。また、開発したソフトウエアをより多くの人々に使ってもらえるように、GitHubにソースコードをあげるだけではなく、企業と共同でWebデモを作成したり、GUIを備えたソフトウエアとしてパッケージングして整備していく予定である。
|
Research Products
(6 results)