• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

グラフデータの機械学習における特徴表現設計の体系化

Research Project

Project/Area Number 17H01783
Research InstitutionHokkaido University

Principal Investigator

瀧川 一学  北海道大学, 情報科学研究科, 准教授 (10374597)

Project Period (FY) 2017-04-01 – 2021-03-31
Keywords機械学習 / グラフデータ
Outline of Annual Research Achievements

本研究課題では、有機低分子の活性・物性予測タスクを念頭に、代表者が近年注力してきたグラフ表現を持つデータの機械学習において、どのような特徴表現が良いかの特徴設計問題に取り組んでいる。データがグラフとして与えられる場合、最も汎用的な特徴量が部分構造特徴を部分グラフパターンの有無で表現したものであり、ケモインフォマティクスにおいても構造キー、ハッシュフィンガープリント、ECFPなどとして広く活用されている。本年度は、これを踏まえ、次の3点の課題について検討を行った。(1)部分グラフの有無の特徴量(指示子)は数が膨大であるため、事前に列挙しないでパターン探索とともに予測モデルの学習を行う方式が望ましい。この点において従来のように逐次的に一つづつ部分グラフ特徴を探索しブースティングの枠組みで加法的な予測をするのではなく、部分グラフ特徴の組合せを決定木・回帰木の学習として行い、非線形な予測子を構成するアルゴリズムを開発した。このために必要な枝刈り上界なども導出した。(2)部分グラフの有無で0か1かの指示子変数とするのではなく、部分グラフパターンにk個のワイルドカードマッチを許容した特徴量(頂点や辺のラベルがk個整合しない条件下での緩和した部分グラフ同型)の効率的な探索アルゴリズムを導出し、その機械学習への応用について実験的に評価を行った。(3)従来までのアルゴリズムは部分グラフパターンの探索木を厳密に深さ優先で探索するgSpanアルゴリズムの探索に基づいていた。しかし実験的には部分グラフパターンは非常に数が多いため、類似する効果を持つ部分グラフパターンが多数存在し、厳密探索を緩和しても予測精度が下がらないことがわかっている。そこで3種類の確率的探索を導入した場合の効率について検証を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

計画していた検討課題については研究実績の概要で挙げた通り一定の成果が得られた。また、研究会などで成果発表を行った。

Strategy for Future Research Activity

(1)の課題で分かったこととして、部分グラフパターンは非常に数が多く、また互いに強い相関を持ちうるため、加法的に線形予測子として組合せるだけでも十分な予測精度が得られることが多い。一方で、人工的な例ながら非線形な仮説が表現できないと実際に精度が得られない事例も確認できており、仮説の線形 vs 非線形の問題と、パターン表現(組合せ量を考慮するかどうか)自体の自由度の問題との間について、さらに検討を進める計画である。また、組合せ探索を複雑化すると計算量が増えて実用的にならない場合も多いため、(2)(3)の課題を通してパターン表現の緩和と探索や学習のランダマイズについても引き続き検討を行う。

  • Research Products

    (17 results)

All 2018 2017

All Journal Article (4 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (13 results) (of which Int'l Joint Research: 1 results,  Invited: 6 results)

  • [Journal Article] Machine Learning Predictions of Factors Affecting the Activity of Heterogeneous Metal Catalysts2018

    • Author(s)
      Takigawa Ichigaku、Shimizu Ken-ichi、Tsuda Koji、Takakusagi Satoru
    • Journal Title

      Nanoinformatics

      Volume: 1 Pages: 45~64

    • DOI

      10.1007/978-981-10-7617-6_3

    • Open Access
  • [Journal Article] Toward effective utilization of methane: machine learning prediction of adsorption energies on metal alloys2018

    • Author(s)
      Toyao T, Suzuki K, Kikuchi S, Takakusagi S, Shimizu K, Takigawa I
    • Journal Title

      The Journal of Physical Chemistry C

      Volume: 122 (15) Pages: 8315-8326

    • DOI

      10.1021/acs.jpcc.7b12670

    • Peer Reviewed
  • [Journal Article] Machine learning reveals orbital interaction in materials2017

    • Author(s)
      Lam Pham Tien、Kino Hiori、Terakura Kiyoyuki、Miyake Takashi、Tsuda Koji、Takigawa Ichigaku、Chi Dam Hieu
    • Journal Title

      Science and Technology of Advanced Materials

      Volume: 18 Pages: 756~765

    • DOI

      10.1080/14686996.2017.1378060

    • Peer Reviewed
  • [Journal Article] Genomic copy number variation analysis in multiple system atrophy2017

    • Author(s)
      Hama Yuka、Katsu Masataka、Takigawa Ichigaku、Yabe Ichiro、Matsushima Masaaki、Takahashi Ikuko、Katayama Takayuki、Utsumi Jun、Sasaki Hidenao
    • Journal Title

      Molecular Brain

      Volume: 10 Pages: 54

    • DOI

      10.1186/s13041-017-0335-6

    • Peer Reviewed
  • [Presentation] グラフ分類における部分グラフ特徴集合の確率的探索2018

    • Author(s)
      白川 稜・岡崎文哉・瀧川一学
    • Organizer
      人工知能学会 第105回人工知能基本問題研究会(SIG-FPAI)
  • [Presentation] 部分グラフとその共起を用いたグラフ分類2018

    • Author(s)
      岡崎文哉・瀧川一学
    • Organizer
      人工知能学会 第105回人工知能基本問題研究会(SIG-FPAI)
  • [Presentation] 決定化されたグラフパターントライの学習アルゴリズム2018

    • Author(s)
      坂上陽規・栗田和宏・瀧川一学・有村博紀
    • Organizer
      人工知能学会 第105回人工知能基本問題研究会(SIG-FPAI)
  • [Presentation] Frontiers of data-driven property prediction: molecular machine learning2018

    • Author(s)
      Ichigaku Takigawa
    • Organizer
      Innovation Camp 2018 for Computational Materials Science (ICCMS2018)
    • Invited
  • [Presentation] 分子のグラフ表現と機械学習2018

    • Author(s)
      瀧川一学
    • Organizer
      異分野融合ワークショップ「データ科学との融合による化学の新展開」
    • Invited
  • [Presentation] Machine learning predictions of factors affecting the activity of heterogeneous metal catalysts2018

    • Author(s)
      Takigawa I, Shimizu K, Tsuda K, Takakusagi S
    • Organizer
      The 255th ACS (American Chemical Society) National Meeting
    • Int'l Joint Research / Invited
  • [Presentation] 定量的構造活性相関予測における化合物特徴表現の実験的検証2017

    • Author(s)
      越野 沙耶佳・岡崎 文哉・瀧川一学
    • Organizer
      2017年度人工知能学会全国大会(第31回)
  • [Presentation] 組成情報と要素特徴量の統合に基づく化学反応量の予測2017

    • Author(s)
      鈴木 慶介・瀧川一学・清水 研一・高草木 達
    • Organizer
      2017年度人工知能学会全国大会(第31回)
  • [Presentation] 系列二分決定グラフを用いた頻出部分グラフの圧縮表現2017

    • Author(s)
      岡崎文哉・奥山葉月・瀧川一学・ 湊 真一
    • Organizer
      2017年度人工知能学会全国大会(第31回)
  • [Presentation] 全部分グラフ指示子に基づく決定木の勾配ブースティング2017

    • Author(s)
      横山侑政・瀧川一学
    • Organizer
      2017年度人工知能学会全国大会(第31回)
  • [Presentation] 機械学習は化学研究の"経験と勘"を合理化できるか?2017

    • Author(s)
      瀧川一学
    • Organizer
      電気化学会 第33回ライラックセミナー・第23回若手研究者交流会,
    • Invited
  • [Presentation] 合成変量とアンサンブル:回帰森と加法モデルの要点2017

    • Author(s)
      瀧川一学
    • Organizer
      電子情報通信学会 信号処理研究会(SIP)
    • Invited
  • [Presentation] グラフデータの機械学習における特徴表現の設計と学習2017

    • Author(s)
      瀧川一学
    • Organizer
      日本応用数理学会 2017年度年会
    • Invited

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi