研究領域 | ナノ構造情報のフロンティア開拓-材料科学の新展開 |
研究課題/領域番号 |
26106506
|
研究機関 | 東京大学 |
研究代表者 |
本多 淳也 東京大学, 新領域創成科学研究科, 助教 (10712391)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | 機械学習 |
研究実績の概要 |
融点や電気伝導度といった特定の物性に優れる新規材料を発見することは材料科学における主要な問題の一つであるが、その候補となる材料は膨大な数があり、それらの全てを実際に合成してその物性を調べることは非現実的である。そこで本研究では現在得られている材料のデータから未知の物性を予測し、効率的に次に探索を行う材料を決定する実験計画法の手法開発を行った。 このように探索により情報を得る候補を動的に選択する問題は機械学習の分野では多腕バンディット問題として研究が行われており、ウェブ広告やニュース配信においてクリック率を最大化する問題等に応用されている。しかし、このような機械学習分野での応用ではクリックの有無など報酬が0または1といった有界な範囲に収まる場合を主に扱うため、既存手法のほとんどはその性質に大きく依存したものとなっている。そのため、報酬の範囲が事前には大雑把にしか特定できない材料探索の場合には直接用いることができない。 そこで本研究では非有界な報酬モデルのうち最も基本的な設定として、報酬が分散未知の正規分布にしたがう場合について漸近最適となる探索戦略の構成を行った。この報酬モデルは96年に理論限界が導出されて以降様々な戦略が提案されてきたが、本研究はその理論限界を初めて達成したものであり、機械学習トップレベルの国際会議であるAISTATSに採録された。 また、同じく報酬が非有界なモデルで一般的なものとして報酬の上界のみが既知の一般のノンパラメトリックモデルを考えるものがある。この問題に対しても本研究では上記論文とは異なるアプローチにより漸近最適となる戦略を構成し、機械学習トップの論文誌JMLRに採録された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
バンディット問題の探索戦略は現代の機械学習的手法に基づく意思決定手段として一般的に用いられるものであり、それをより材料探索により即した形に発展させるという点で本研究は大きな成果が得られた。 ただし、バンディット問題における目的には二通りがあり、これらはそれぞれ累積報酬の最大化、もう一つが報酬期待値最大の候補の発見として定式化される。これらは前者は材料あるいは試料の収量の最大化、後者は物性最良の材料の発見に対応しており、その両者はともに重要な問題であるが、本研究では前者の定式化において特に優れた結果が得られたが、後者の定式化についてはまだ進行中であり、全体としては標準的な進捗状況といえる。
|
今後の研究の推進方策 |
今後の研究では、これまでの報酬最大化のためのバンディット戦略を期待値最大の候補の識別問題のためのものに応用するとともに、観測および報酬モデルについてより材料探索に即した形に発展させる方法を構築する。本年度に扱ったバンディット問題の定式化では各探索候補からの観測がお互いに無相関とする基本的な設定を扱ったが、実際の材料探索ではある候補に関する物性値から別の候補の物性値について部分的な情報が得られることが多い。このように、ある候補からの報酬および観測情報が別の候補についての情報をもつとする設定はバンディット問題の一般化として部分観測問題とよばれいくつかの研究があるが、これらは問題の複雑さのため限定的な設定でのみしか適用できる結果しか知られていない。 そこで今後の研究では部分観測問題に対して汎用的に用いることができる探索戦略の構成を行う。部分観測問題では理論限界が無限個の制約式をもつ最適化問題の解として与えられるために目指すべき探索の配分比が陽には求まらないことが難しさの大きな要因となっている。一方、このような種類の最適化問題はこれまでに扱ったノンパラメトリックモデル上のバンディット問題でも現れるものであり、それらの解析手法を応用することで効率的な探索手法が構築できると考えられる。
|