研究課題/領域番号 |
21K17745
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 北海道大学 |
研究代表者 |
胡 晟 北海道大学, 化学反応創成研究拠点, 特任助教 (70846360)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | Graph Neural Network / Graph Generation / Monte Carlo Tree Search / Molecular Optimization / Recommendation System / Graph Mining |
研究開始時の研究の概要 |
本研究では,グラフ部分構造の組合せ的な構成性を考慮しデータベースにはないグラフも提示できるよう,Graph Neural Networkに基づく生成モデルを用いた自動補完アルゴリズムの開発を行う.具体的には,①ユーザの編集を感知できるグラフ自動補完と補完結果のランキング,②グラフ分割によるGraph Neural Networkの学習,③システムとしての実装及び評価の3つの課題に取り組む.
|
研究実績の概要 |
本研究の目的であるGraph Neural Networkに基づく生成モデルを用いた自動補完アルゴリズムの開発について、3つのサブテーマのうち「③システムとしての実装及び評価」を中心に取り組んだ。
「③システムとしての実装及び評価」については、分子推薦システムのウェブアプリケーションを開発し、北海道大学学内のネットワークで公開した。このシステムでは、生成された分子の3D構造を視覚的に表現する機能や、出力分子と入力分子の差異を強調表示する機能(ハイライト機能)を実装した。さらに、有用性を向上させるために、化学研究者との議論を通じて、入力分子構造と出力分子構造との違いをスコア化して示している。また、このシステムをより実用的にするため、ユーザーとのコミュニケーションをとりながら、以前実装したシステムの操作手順をもっと簡潔で使いやすいものに改善した。 改善した機能は以下の通りである: 1) 入力方法は、手書きで分子を描くか、SMILES文字列を使用して「Draw SMILES」機能を使うことができる。2) 物性計算機能を使用すると、現在の分子の物性が表示される。3) オートコンプリート/ステップバイステップ機能を両方使用すると、右側のパネルに最適化された分子が表示される。違いは、増分関数群の細かさである。後者は前者よりも小さくなる。4) 「3D models」機能を使用すると、3Dインスペクタが提供される。現在は5種類の3Dモデルがサポートされている。5) 候補グラフとクエリグラフの間の最大共通構造が計算され、違いを視覚的に示すために赤で強調表示される。さらに、クエリグラフとの類似性スコアも計算される。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ウェブアプリケーションの機能の更新や学内での公開により、研究成果の実用化が順調に進んでいる。研究背景の調査やアルゴリズムの開発についても、当初の計画通りに大まかな進捗がある。 詳細に述べると、 1) 分子の表現や構造の処理など、SMILES文字列を使用してアルゴリズムを開発した。 2) 分子の物性計算には、RDKitの分子記述子を利用して開発した。 3) 分子の類似性判定や可視化には、候補グラフとクエリグラフの間の最大共通部分構造アルゴリズムを採用して開発した。 4) 分子の3Dインスペクタは、サードパーティの可視化ライブラリを導入して開発した。
|
今後の研究の推進方策 |
ユーザーの意図を学習し、その嗜好に基づいて推薦するシステムの開発を中心に進めながら、実用性をさらに向上させるために、会話形式を導入して、システムの操作性を向上させる取り組みを行う。
|