• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

Research on inverse analysis and scientific interpretation of property prediction models

Research Project

Project/Area Number 19K15352
Research InstitutionMeiji University

Principal Investigator

金子 弘昌  明治大学, 理工学部, 専任准教授 (00625171)

Project Period (FY) 2019-04-01 – 2023-03-31
KeywordsQSPR / QSAR / 予測精度 / モデルの解釈
Outline of Annual Research Achievements

機械学習を用いて構築した物性予測モデルおよび活性予測モデルにより、分子設計や材料開発の効率化が見込まれる。さらにそのモデルを解釈することによって、物性・活性に関する新たなメカニズムの発見も期待できる。機械学習を活用した物性・活性予測モデル構築手法はこれまで数多く開発されているものの、予測性と解釈性のどちらにも優れたモデル構築手法の開発は発展途上である。これは、予測性と解釈性はトレードオフの関係にあることが原因である。例えば決定木 (DT) による回帰モデルは解釈できる一方で予測精度が低い傾向がある。ランダムフォレスト (RF) はアンサンブル学習法によりDTの予測精度を向上できるが、モデルの解釈は難しくデータセット全体のXの重要度しか計算できない。
そこで本研究では、DTとRF を組合せた手法 DT-RF を提案した。まずデータセットを用いてDTを構築する。このDTモデルは解釈ができる一方で、予測精度は低いと考えられる。そこで、DTモデルにより分割された末端ノードのサンプル群をサブデータセットとして、サブデータセットごとにRFモデルを構築する。これにより局所的な非線形モデルが構築され、予測精度が向上する。さらに、既存のRFモデルではデータセット全体における変数の重要度しか議論できなかったが、提案するRFモデルの変数の重要度により、例えば目的変数の値が大きいサンプル軍における変数の重要度や、目的変数の値が小さいサンプル群における変数の重要度を個別に議論できる。以上のように、提案手法により高い解釈性と高い予測性能を持つ物性・活性予測モデルを構築することができると考えられる。
提案手法の有効性を検証するため、各種化合物データセットや無機超伝導体データセットで、ケーススタディを行い、提案手法の予測精度と解釈性およびその妥当性を検証した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

既存のモデルと比較して、モデルの予測精度の向上およびモデルの解釈性の向上を達成したため

Strategy for Future Research Activity

昨年度の研究により、決定木とランダムフォレストを組み合わせることで、物性予測モデルおよび活性予測モデルの予測精度の向上、そしてモデルの解釈性の向上を達成した。今後は、データ分布として確率分布を仮定したモデリングにより、説明変数のデータセットと複数の目的変数のデータセットとを合わせて、同時確率分布を計算する。確率分布として正規分布の重ね合わせを仮定することで、expectation-maximizationアルゴリズムにより解を獲得できるだけでなく、高精度に同時確率分布を表現できる。Gaussian mixture modelsを回帰分析に応用することで検討する。
説明変数と目的変数の同時確率分布が得られることで、ベイズの定理および確率の乗法定理により、説明変数が与えられたときの目的変数の事後分布および目的変数が与えられたときの説明変数の事後分布を計算できる。前者が物性予測モデル、後者がモデルの逆解析に対応する。つまり、説明変数もしくは目的変数の値が与えられれば、それを満たすための最も確率の高い目的変数もしくは説明変数の値が得られる。なお同時確率分布では説明変数と目的変数を明示的に分ける必要はなく、目的変数が複数でも全く問題ない。

Causes of Carryover

物品購入および旅費それぞれの端数のため 742 円が生じました。次年度の物品購入費として使用いたします。

  • Research Products

    (14 results)

All 2020 2019

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (12 results) (of which Int'l Joint Research: 4 results,  Invited: 4 results) Book (1 results)

  • [Journal Article] Development of Ensemble Learning Method Considering Applicability Domains2019

    • Author(s)
      Keigo Sato, Hiromasa Kaneko
    • Journal Title

      Journal of Computer Chemistry, Japan

      Volume: 18 Pages: 187-193

    • DOI

      https://doi.org/10.2477/jccj.2019-0010

    • Peer Reviewed
  • [Presentation] ベイズ最適化に基づくエチレンオキシド製造プロセスの設計2020

    • Author(s)
      岩間稜, 金子弘昌
    • Organizer
      化学工学会第85年会
  • [Presentation] プロセス変数と時間遅れを同時に最適化した適応型ソフトセンサーの開発2020

    • Author(s)
      山田信仁, 金子弘昌
    • Organizer
      化学工学会第85年会
  • [Presentation] ベイズ最適化に基づく適応型ソフトセンサー選択手法の開発2020

    • Author(s)
      山影柊斗, 金子弘昌
    • Organizer
      化学工学会第85年会
  • [Presentation] 安全性が高い高熱伝導率を有する冷媒の設計2020

    • Author(s)
      山本統久, 金子弘昌
    • Organizer
      化学工学会第85年会
  • [Presentation] 誘電率と安定性を考慮した高分子材料のモノマー設計2020

    • Author(s)
      谷脇寛明, 金子弘昌
    • Organizer
      化学工学会第85年会
  • [Presentation] データサイエンスによる高機能材料の研究・開発・評価・製造の支援2020

    • Author(s)
      金子弘昌
    • Organizer
      先端化学・材料技術部会 CC分科会 講演会
    • Invited
  • [Presentation] Nonlinear Dynamic Feature Extraction Based on Gaussian Process Dynamical Models for Jit-Based Adaptive Soft Sensors2019

    • Author(s)
      Yasuhiro Kanno, Hiromasa Kaneko
    • Organizer
      2019 AIChE Annual Meeting
    • Int'l Joint Research
  • [Presentation] Constructing Interpretable and Accurate Model Combining Decision Tree and Random Forest2019

    • Author(s)
      Naoto Shimizu, Hiromasa Kaneko
    • Organizer
      2019 AIChE Annual Meeting
    • Int'l Joint Research
  • [Presentation] New Evaluation Method of Soft Sensors Considering Characteristics of Time Series Data2019

    • Author(s)
      Takumi Kojima, Hiromasa Kaneko
    • Organizer
      2019 AIChE Annual Meeting
    • Int'l Joint Research
  • [Presentation] Molecular, Material, Product and Process Design and Process Control Based on Materials Informatics, Chemoinformatics and Process Informatics2019

    • Author(s)
      Hiromasa Kaneko
    • Organizer
      Materials Research Meeting 2019
    • Int'l Joint Research / Invited
  • [Presentation] データ解析および機械学習による高機能材料の研究・開発・製造の支援2019

    • Author(s)
      金子弘昌
    • Organizer
      日本化学会 産学交流委員会 R&D懇話会
    • Invited
  • [Presentation] 生成モデルによるデータの可視化・回帰分析・クラス分類・モデルの適用範囲の設定・モデルの逆解析・分子設計・材料設計2019

    • Author(s)
      金子弘昌
    • Organizer
      第63回日本薬学会関東支部大会
    • Invited
  • [Book] 化学のためのPythonによるデータ解析・機械学習入門2019

    • Author(s)
      金子 弘昌
    • Total Pages
      240
    • Publisher
      オーム社
    • ISBN
      978-4-274-22441-6

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi