本研究では材料探索の問題において膨大な候補数のある材料のうちから優れた物性をもつ新規材料を効率的に探索するための機械学習的な手法の開発を行った。このように探索を行った候補についてのみ情報が得られるという状況下で次の探索候補を動的に決定する問題は多腕バンディット問題とよばれる。この問題では通常では各時刻ごとに探索する候補を1個だけ決定するものであるが、実際の応用では同時に複数の候補について並列的に合成あるいは物理計算を行うという状況が一般的である。このように単位時刻ごとに複数の候補を選択するという問題では漸近最適となる戦略の存在が理論的には示されていたものの、これは実際の計算がほぼ不可能な指標を用いるものであった。そこで本研究ではトンプソンサンプリングとよばれる乱択手法を応用することで候補数に関して線形な計算量で漸近最適となる探索戦略を構成した。この結果は機械学習トップレベルの国際会議であるICMLに採録された。 さらに、材料探索ではある候補に関する物性値等の情報が別の候補についての部分的な情報を含んでいるという場合が多いが、このような設定は多腕バンディット問題の一般化として部分観測問題とよばれる。この問題では累積損失が対数オーダーで抑えられることが理論限界の議論により示唆されていたが、従来では対数オーダーの損失が達成可能であることが示されていたのは非常に限定的な状況に限られており、一般の状況では損失が多項式オーダーとなる戦略しか知られていなかった。そこで本研究ではこれまで申請者が構築してきた尤度に基づく探索手法を半無限計画法の理論と組み合わせることにより一般の状況に対して理論限界を達成する戦略を構成した。この結果は機械学習で最も権威のある国際会議NIPSに採録された。
|