• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

Discovery of innovative functional materials using state-of-the-art machine learning

Research Project

Project/Area Number 19H01132
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

吉田 亮  統計数理研究所, データ科学研究系, 教授 (70401263)

Project Period (FY) 2019-04-01 – 2024-03-31
Keywordsマテリアルズインフォマティクス / 機械学習 / 分子設計 / 逆合成経路解析 / 転移学習
Outline of Annual Research Achievements

所望の特性を有する新物質を探索する機械学習の手法を開発した.研究成果の概要は,以下の通りである.
(1) 標的分子の合成経路を設計するベイズ推論のアルゴリズムを開発した.合成反応のデータベースを用いて,任意の反応物に対する生成物の予測モデルを構築する.次に条件付き確率のベイズ則に従い,この順方向のモデルを反転し,生成物から反応物の予測モデルを導く.最後に,逐次モンテカルロ法を適用し,市販化合物のリストから所望の生成物を導く反応物の組み合わせを探索する.本研究成果をGuo et al. J Chem Inf Model. 2020にて発表した.
(2) 少数データに対するデータ科学の方法論の構築するために,転移学習の研究を実施した.具体的には,ベイズ推論のアイデアを導入し,特定のモデルに依存しない転移学習の一般的な方法論を構築した(Minami et al. AAAI. 2021).提案手法を特徴付ける二つのハイパーパラメータを選択することで,これまで独立に研究が進展してきた三つの既存手法(密度比推定,ベイズ更新,深層転移学習)を定式化できる.また,ハイパーパラメータを特定の値に設定することで,既存手法のハイブリッド型学習を実現できる.現在,提案手法を材料研究に投入し,実証研究を展開している.
(3) 元素の特徴量から周期表を自動設計する教師なし学習のアルゴリズムを開発した(Kusaba et al. Sci Rep. 2021).多次元の元素データから規則性を発見し,二次元座標上の格子点に配置する.すなわち,高次元データの「テーブル」形式の次元削減に問題を帰着させた上で.独自の教師なし学習の方法論を構築した.実データに提案手法を適用し,標準的な周期表を概ね再現できることを実証した.さらに,現在の最新の元素データに提案手法を適用し,3次元円錐螺旋型の周期表を構築した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

分子設計の機械学習アルゴリズムについては,方法論の数理的基盤,アルゴリズムの設計,実装が概ね完了した.実験やシミュレーションから得られた化学構造と特性のデータを用いて,教師あり学習で化学構造から特性の予測モデルを構築する.これに条件付き確率のベイズ則を適用し,特性から構造の逆方向のモデルを導く.既存化合物のパターンを学習させた確率言語モデルを用いてモンテカルロ計算を行い,逆方向のモデルから仮説構造を発生させ,所望の特性を有する埋蔵分子を発掘する.本グループが開発しているオープンソースソフトウェアXenonPyに提案手法を実装した.現在はハンズオンセミナーの開催やYouTubeでの動画配信などを通じて,ユーザーの拡大を図っている.

また,今年度は提案された候補分子の合成経路を設計する手法も開発した.米国特許化合物の反応データセットを用いて包括的な数値実験を実施し,既知の経路に対する予測性能や提案された経路の化学的妥当性を検証した.その結果,1ステップの反応経路の予測では80.3%,2ステップの反応経路では50.0%の精度で既存の合成経路を予測できることが分かった.また,予測された新規の反応経路に対し,有機合成の知見に基づき候補経路の合成可能性を評価した.その結果,約35-60%の候補が化学的に実現可能であるという結論に至った.

さらに,これらの手法を用いて実証研究を展開している.特に,高分子熱物性の実証研究では,従来の高分子に比べて約80%の高い熱伝導率を有する新しい高分子を発見すること成功している(Wu et al. npj Comput Mater. 2019).今後も様々な材料系に提案手法を適用していき,実証フェーズを加速していく.

Strategy for Future Research Activity

今後は以下の外部プロジェクトと連携しながら,実証フェーズを加速していきたい.提案手法を材料研究に展開し,理論と実践をフィードバックさせる形で研究を進める.

(1) 本センターの研究グループは,2019年に始動したJST-CREST熱制御領域「高分子の熱物性マテリアルズインフォマティクス」(代表:東京工業大学 森川淳子教授)に参画している.提案手法を本プロジェクトに投入し,高分子の熱動態の理解と高い熱伝導性を有する新材料の発見を実現する.
(2) 本センターのグループは,2019年に始動した科研費新学術領域「ハイパーマテリアル:補空間が創る新物質科学」(領域代表:東京理科大学 田村隆治 教授)に参画している.準結晶は通常の周期結晶のような並進対称性を持たないが,原子配列に高度な秩序がある物質群である.最初の準結晶の発見からおよそ35年間で100種類以上の準結晶が見つかっている.準結晶の発見は新しい固体構造の概念を確立された.しかしながら,近年は準結晶の発見のペースが著しく鈍化している.我々は,機械学習の先進技術(XenonPyに実装)を駆使して,新しい準結晶の発見を加速し,準結晶の形成メカニズムの理解を促進する.
(3) 本グループが開発しているオープンソースソフトウェアXenonPyは,様々な材料研究に活用できる汎用ツールである.現在は国内外の多くのユーザーが本ソフトウェアを利用して材料研究を展開している.例えば,統計数理研究所ものづくりデータ科学研究センター(センター長:吉田)は多数の企業との共同研究を推進しており,有機・無機・複合材料を含む幅広い分野でXenonPyを活用した材料開発を推進している.これらの研究体制を実証フェーズの1チャンネルに位置付け,本プロジェクトを推進していく.

  • Research Products

    (29 results)

All 2021 2020 Other

All Journal Article (5 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 3 results,  Open Access: 4 results) Presentation (23 results) (of which Int'l Joint Research: 2 results,  Invited: 21 results) Remarks (1 results)

  • [Journal Article] Recreation of the periodic table with an unsupervised machine learning algorithm2021

    • Author(s)
      Kusaba Minoru、Liu Chang、Koyama Yukinori、Terakura Kiyoyuki、Yoshida Ryo
    • Journal Title

      Scientific Reports

      Volume: 11 Pages: 4780

    • DOI

      10.1038/s41598-021-81850-z

    • Peer Reviewed / Open Access
  • [Journal Article] A general class of transfer learning regression without implementation cost2021

    • Author(s)
      Shunya Minami, Song Liu, Stephen Wu, Kenji Fukumizu, Ryo Yoshida
    • Journal Title

      Proceedings of the AAAI Conference on Artificial Intelligence

      Volume: in press Pages: -

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Machine learning to predict quasicrystals from chemical compositions2021

    • Author(s)
      Chang Liu, Erina Fujita, Yukari Katsura, Yuki Inada, Asuka Ishikawa , Ryuji Tamura, Kaoru Kimura, and Ryo Yoshida
    • Journal Title

      Nature Portfolio

      Volume: - Pages: -

    • DOI

      10.21203/rs.3.rs-240290/v1 (preprint, under review)

    • Open Access
  • [Journal Article] マテリアルズインフォマティクスによる新物質探索:高分子材料の設計を中心に.2021

    • Author(s)
      吉田 亮
    • Journal Title

      医学の歩み

      Volume: 276 Pages: 861-865

  • [Journal Article] Bayesian Algorithm for Retrosynthesis2020

    • Author(s)
      Zhongliang Guo, Stephen Wu, Mitsuru Ohno, Ryo Yoshida
    • Journal Title

      Journal of Chemical Information and Modeling

      Volume: 60 Pages: 4474-4486

    • DOI

      10.1021/acs.jcim.0c00320

    • Peer Reviewed / Open Access
  • [Presentation] マテリアルズインフォマティクス概説2021

    • Author(s)
      吉田亮
    • Organizer
      日本化学会 第101春季年会(2021)
    • Invited
  • [Presentation] 機械学習による予測と発見:準結晶と高分子研究への適用事例2021

    • Author(s)
      吉田亮
    • Organizer
      物質・材料研究機構 MaDIS研究交流会
    • Invited
  • [Presentation] データ駆動型材料研究の現在と未来2021

    • Author(s)
      吉田亮
    • Organizer
      日本化学会第38回コロイド界面技術シンポジウム「みんなを元気にするすごい技術 アフターコロナの研究開発 ~動向/指針/変化する研究」
    • Invited
  • [Presentation] データ科学の視点からみた計算科学との価値共創の在り方2021

    • Author(s)
      吉田亮
    • Organizer
      JST-CRDSS俯瞰セミナーシリーズ「数学と自然科学、工学の連携」
    • Invited
  • [Presentation] マテリアルズ・インフォマティクスの基礎と応用:機械学習による物質・材料の表現と生成2021

    • Author(s)
      吉田亮
    • Organizer
      兵庫県マテリアルズ・インフォマティクス講演会(第5回)
    • Invited
  • [Presentation] Advances in Polymer Informatics: Challenges and Potentials2021

    • Author(s)
      Ryo Yoshida
    • Organizer
      NSF-JST joint workshop on Thermal Transport, Materials Informatics and Quantum Computing
    • Int'l Joint Research / Invited
  • [Presentation] マテリアルズインフォマティクス概論2020

    • Author(s)
      吉田亮
    • Organizer
      CMCリサーチセミナー
    • Invited
  • [Presentation] データ駆動型物質・材料研究を駆動する統計的機械学習の先進技術:準結晶への応用など2020

    • Author(s)
      吉田亮
    • Organizer
      日本学術振興会・第133委員会 第246回研究会
    • Invited
  • [Presentation] 機械学習による準結晶の組成予測2020

    • Author(s)
      吉田亮
    • Organizer
      第14回物性科学領域横断研究会
    • Invited
  • [Presentation] マテリアルズインフォマティクスの概論と記述子、実験計画法の設計2020

    • Author(s)
      吉田亮
    • Organizer
      技術情報協会セミナー
    • Invited
  • [Presentation] 統計的機械学習による材料の表現と生成:新分野の開拓と障壁2020

    • Author(s)
      吉田亮
    • Organizer
      機能性色素部会・エレクトロニクス部会合同 公開講演会「マテリアルインフォマティクスの最近の動向」
    • Invited
  • [Presentation] 材料研究を変革する統計的機械学習の先進技術2020

    • Author(s)
      吉田亮
    • Organizer
      SciPy Japan 2020
    • Invited
  • [Presentation] マテリアルズインフォマティクス:機械学習による設計と合成の自動化2020

    • Author(s)
      吉田亮
    • Organizer
      CBI学会2020年大会「科学実験の自動化が拓くAI時代の創薬研究」
    • Invited
  • [Presentation] スモールデータの壁を乗り越えるための MI 技術2020

    • Author(s)
      吉田亮
    • Organizer
      第13回日本化学連合シンポジウム「AI、IoT 活用による実験のスマート化」
    • Invited
  • [Presentation] 物質・材料研究におけるデータ科学の活用:基礎と応用2020

    • Author(s)
      吉田亮
    • Organizer
      Science & Technologyセミナー
    • Invited
  • [Presentation] マテリアルズインフォマティクス:黎明期からの脱却に向けて2020

    • Author(s)
      吉田亮
    • Organizer
      日本化学会 講演会「インフォマティクス技術の導入から産業応用まで~高分子・機能性材料・バイオ・半導体」
    • Invited
  • [Presentation] 高分子MIのオーバービュー2020

    • Author(s)
      吉田亮
    • Organizer
      高分子学会 Webinar,
    • Invited
  • [Presentation] データ科学による新物質の探索:現状と展望2020

    • Author(s)
      吉田亮
    • Organizer
      2020年度統計関連学会連合大会
    • Invited
  • [Presentation] ベイズ推論に基づく有機化合物の合成経路設計2020

    • Author(s)
      Guo Zhongliang, 吉田亮
    • Organizer
      2020年度統計関連学会連合大会
  • [Presentation] 高分子材料研究を駆動する統計的機械学習の先進技術2020

    • Author(s)
      吉田亮
    • Organizer
      第81回応用物理学会秋季学術講演会シンポジウム
    • Invited
  • [Presentation] ベイズ推論に基づく逆合成経路探索2020

    • Author(s)
      Guo Zhongliang, 吉田亮
    • Organizer
      第9回生命医薬情報学連合大会(IIBMP2020)
  • [Presentation] マテリアルズインフォマティクスの諸問題:スモールデータの壁を乗り越える2020

    • Author(s)
      吉田亮
    • Organizer
      日本学術振興会 145委員会 第168回研究会
    • Invited
  • [Presentation] Machine Learning for Materials Discovery2020

    • Author(s)
      Ryo Yoshida
    • Organizer
      Bristol-ISM Data Science Seminar Series
    • Int'l Joint Research / Invited
  • [Remarks] XenonPy: Python library for materials informatics

    • URL

      https://xenonpy.readthedocs.io/en/latest/

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi