• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

データ科学と計算科学の協働に基づく物質探索システム

研究課題

研究課題/領域番号 19K12007
研究機関金沢工業大学

研究代表者

林 亮子  金沢工業大学, 工学部, 准教授 (30303332)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードデータ科学 / 計算科学 / データマイニング / マテリアルインフォマティクス / 材料設計 / 物性予測
研究実績の概要

2019年度は,「実験的事実を計算科学とデータ科学で補完可能か?」という問いに取り組むために,計算科学によって実験データの不足分を追加することを目標とし,沸点と融点の実験データの分類および予測を試験的に行った.
本研究では「国際化学物質安全性カード」のウェブサイトで公開されているデータを基本的に使用する.今回使用するのは炭素,酸素および水素からなる化学物質に限る.記述子は,分子量,炭素原子個数,ベンゼン環や炭素原子間の二重結合と三重結合,水酸基などの15種類の構造の個数を使用する.そのため記述子は18個となる.
今回使用するデータは全部で294件であり,これらを学習データとテストデータに分ける.今回テストデータは全データの10%程度の30件とし,学習データを残りの264件とした.テストデータは,ベンゼン環の個数,分子量,直鎖,カルボニル基の個数を用いて分子を一旦グループ分けし,一様乱数を用いて各グループから10%ずつテストデータを抽出した.テストデータは学習には使用せず,沸点および融点を予測する性能評価にのみ使用する.本研究では統計プログラミング言語Rの決定木に関連するパッケージを利用する.
沸点を分類する決定木を作成した結果,分子量が最も沸点に影響し,酸素個数,水酸基個数も沸点への影響が大きいことを示唆していた.テストデータをこの決定木で分類すると得られる予測沸点は,RMSE=34.7, 誤差絶対値は最大74.5Kであった.
融点を分類する決定木を作成した結果,最初にベンゼン環個数,水酸基個数,分子量が融点に大きく影響することを示唆していた.テストデータを決定木で分類して得られる予測融点はRMSE=49.3, 誤差絶対値は最大156Kであった.実際に融点の予測は沸点予測よりも誤差絶対値が大きく,分類と予測が困難であった.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本研究課題が目的とする導電性分子ワイヤの類例物質で,強い力で結合した導電性高分子がすでに実用化段階にあって,実験データが蓄積されている.構造もよく調べられており,計算データも作成可能である.そこで本研究課題の最初に導電性高分子の導電性発現に関して,計算科学によって実験的知見を再現できるかどうかを検討する予定であった.導電性高分子に関する調査とデータ収集に手間取っているため,十分着手していない.

今後の研究の推進方策

導電性高分子の導電性発現に関して,計算科学によって実験的知見を再現できるかどうかを検討する.少ないデータでもよいので,試験的に調査しながらデータ収集を行い,導電性高分子に関する知見を深めながら研究を進行する.

次年度使用額が生じた理由

購入を予定していた計算機がモデル変更のため仕様と価格変更があり,次年度交付分と合算しての購入を検討するため,今年度は購入を見合わせました.
また,コロナウイルス流行により,参加予定であった学会が遠隔開催のみとなったり中止になったりしたため,旅費が発生しませんでした.

  • 研究成果

    (1件)

すべて 2019

すべて 学会発表 (1件)

  • [学会発表] 機械学習を用いた分子に関する諸量調査の試み2019

    • 著者名/発表者名
      林 亮子
    • 学会等名
      第42回ケモインフォマティクス討論会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi