研究課題/領域番号 |
17H01783
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 国立研究開発法人理化学研究所 (2019-2020) 北海道大学 (2017-2018) |
研究代表者 |
瀧川 一学 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (10374597)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
12,870千円 (直接経費: 9,900千円、間接経費: 2,970千円)
2020年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2019年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2018年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2017年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
|
キーワード | 機械学習 / グラフデータ / 分子表現 / 表現学習 / 高次元空間 / 特徴設計 |
研究成果の概要 |
本課題では、グラフ表現を持つデータの機械学習の枠組みで、適切な入力特徴表現の設計問題に体系的に取り組んだ。応募者のグラフ線形学習の知見を拡張し、部分グラフ特徴集合上での決定木アンサンブル学習法、部分グラフ探索空間からできるトライ構造による決定木学習、組合せ的な探索空間の確率的探索によるグラフ学習高速化、部分グラフ特徴の共起によるグラフ学習、部分グラフ特徴の探索空間の二分決定ダイアグラムによる圧縮、二重グラフ畳み込みによるグラフを頂点とするグラフ上の機械学習、頂点特徴量を注意機構で適応的に重みづけする学習モデル、ユーザ編集意図を反映する深層グラフ生成による分子グラフ自動補完などの成果が得られた。
|
研究成果の学術的意義や社会的意義 |
分子のグラフ表現の主対象である有機低分子は(a)医薬品、細胞内代謝物、有機EL材料、食品、化粧品、など波及範囲が広い、(b)活性の発現機序がモデル化困難な程に複雑、(c)可能な分子の候補数が組合せ的に巨大、という背景から活性の理解にデータ科学の技術が強く望まれており、本課題で得られる知見により広い波及効果が期待できる。また、グラフ表現データという設定は広い汎用性を持ち、公的リポジトリの多様なアッセイデータに基づく具体的な評価系を多数構築しやすく、強い特徴間相関や指数的な高次元性に由来する困難を体系的に評価できる良いモデルケースとなっている。
|