研究課題/領域番号 |
15H02672
|
研究機関 | 統計数理研究所 |
研究代表者 |
吉田 亮 統計数理研究所, モデリング研究系, 准教授 (70401263)
|
研究分担者 |
本郷 研太 北陸先端科学技術大学院大学, 情報科学研究科, 研究員 (60405040)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | ベイズ統計 / 量子化学 / 分子設計 / 創薬 / シミュレーション |
研究実績の概要 |
新規機能性分子の発掘を目的に,ベイズ推論・言語モデル・第一原理計算を融合させた物質探索アルゴリズムを開発した.実験や理論計算から得られた構造物性相関データに機械学習のアルゴリズムを適用し,物質の構造から物性の順方向モデルを構築する(QSPR: quantitative structure-property relationship analysis).これにベイズ則を適用し,物性から構造の逆方向のモデルを導く.最後に,機械学習により獲得した分子構造の確率モデルを実装したモンテカルロ計算で逆方向モデルから仮説物質を発生させて,所望物性を有する埋蔵物質を発掘する(inverse-QSPR). 平成28年度に機械学習・ベイズ推論に基づく物質探索プログラムiqspr(R言語パッケージ)をリリースした.平成29年度は,iqsprバージョン2.4を開発し,GitHubに公開した.旧バージョンの順方向の予測は線形モデルに限定されていたが,ディープラーニング,ランダムフォレスト,勾配ブースティング,エラスティックネット回帰等の解析手法を実装し,iqsprの機能を拡張した. この技術を用いることで,任意の物性をターゲットに大量かつ高品質の候補物質ライブラリを作製できるようになった.さらに,他のプロジェクトで開発中の深層強化学習に基づく逆合成経路探索アルゴリズムや計算機実験を導入すれば,同定された候補物質の物性検証,合成経路のプランニングまでの工程を完全に自動化できる.さらに,合成・分析との循環系を構築できれば,将来的に短期間で大量の埋蔵物質を発掘できる可能性がある.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
アルゴリズムのプロトタイプは概ね完成した.また,本研究課題の直接的な対象には含まれないが,実践・実証研究も着々と進んでいる. JSTイノベーションハブ構築支援事業「情報統合型物質・材料開発イニシアティブ」において,リチウムイオン電池の有機電解質,高伝熱性液晶ポリマーの開発にiqsprを実践展開している.さらに,民間企業との共同研究において,幅広い材料種を対象に実証研究を推進している. さらに,当初の計画には含まれていなかった研究として,実験計画法を用いて第一原理計算とベイズ推論を融合した外挿アルゴリズムSPACIERの開発にも着手した.機械学習の予測は基本的に内挿的であり,データが存在しない領域においては予測能力を有していない.したがって,iqsprの物質探索は,革新的材料が存在する未踏領域に到達する前に性能が大きく低下するという問題があった.SPACIERは,この限界を突破するために開発されたiqsprの発展版である.iqspr が設計した仮想物質(既存物質のデータが少ない領域に存在)に対し,実験計画法による実験対象の物質の選定・第一原理計算による物性評価を行い,この新たなデータセットをiqsprの 順方向モデルの学習ループに入力することで,iqsprは未踏領域に対する予測性能を新たに獲得する.このループ(計算機実験によるデータの追加と再学習)を繰り返すことで,機械学習のアルゴリズムが提案する仮想物質は未踏領域に到達できるようになる.
|
今後の研究の推進方策 |
プロジェクトは概ね順調に進んでいる.今後は外部プロジェクトと連携しながら,開発手法の実践・実証フェーズに本格的に移行する.
|