• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 研究成果報告書

グラフデータの機械学習における特徴表現設計の体系化

研究課題

  • PDF
研究課題/領域番号 17H01783
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関国立研究開発法人理化学研究所 (2019-2020)
北海道大学 (2017-2018)

研究代表者

瀧川 一学  国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (10374597)

研究期間 (年度) 2017-04-01 – 2021-03-31
キーワード機械学習 / グラフデータ / 分子表現
研究成果の概要

本課題では、グラフ表現を持つデータの機械学習の枠組みで、適切な入力特徴表現の設計問題に体系的に取り組んだ。応募者のグラフ線形学習の知見を拡張し、部分グラフ特徴集合上での決定木アンサンブル学習法、部分グラフ探索空間からできるトライ構造による決定木学習、組合せ的な探索空間の確率的探索によるグラフ学習高速化、部分グラフ特徴の共起によるグラフ学習、部分グラフ特徴の探索空間の二分決定ダイアグラムによる圧縮、二重グラフ畳み込みによるグラフを頂点とするグラフ上の機械学習、頂点特徴量を注意機構で適応的に重みづけする学習モデル、ユーザ編集意図を反映する深層グラフ生成による分子グラフ自動補完などの成果が得られた。

自由記述の分野

機械学習

研究成果の学術的意義や社会的意義

分子のグラフ表現の主対象である有機低分子は(a)医薬品、細胞内代謝物、有機EL材料、食品、化粧品、など波及範囲が広い、(b)活性の発現機序がモデル化困難な程に複雑、(c)可能な分子の候補数が組合せ的に巨大、という背景から活性の理解にデータ科学の技術が強く望まれており、本課題で得られる知見により広い波及効果が期待できる。また、グラフ表現データという設定は広い汎用性を持ち、公的リポジトリの多様なアッセイデータに基づく具体的な評価系を多数構築しやすく、強い特徴間相関や指数的な高次元性に由来する困難を体系的に評価できる良いモデルケースとなっている。

URL: 

公開日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi