研究概要 |
本研究では,リガンド予測のための記述子を自動獲得するアルゴリズムを獲得するものである.開発するアルゴリズムは最適な記述子を自動的に獲得すると同時にリガンドの予測を高精度化するものである.リガンド予測と記述子獲得は相互に依存している.すなわち,予測精度が悪ければ効果的な記述子は得られず,記述子が悪ければ予測精度も悪くなる.そのために,まず高頻度部分グラフを列挙するプログラムを実装した.このプログラムから出力される部分グラフの頻度情報を初期段階の記述子とし,これを非線形合成によって高精度に予測できる記述子の獲得を目指している.そのために,次元間相関情報を組み入れた内積計算アルゴリズムから得られる数量を非線形合成して記述子を算出するアルゴリズムを定式化した.このアルゴリズムは転移学習の考え方を導入したもので,学習アルゴリズムに現れる最適化問題は非凸であるが,必ず最適値を得られることが保証される.得られる記述子は,ある種の経験分布上では,すでに白色化されているが,記述子の写像と相互作用情報の写像はその経験分布から導出される低次元空間において距離の平均が最小される.これによって,リガンドごとに最適な記述子が得られると期待しており,人工データにおいては非常に良好な予測性能を得ることができた.次年度はリガンドとターゲットの相互作用に関する実データを用いた計算機実験を通して開発したアルゴリズムの有用性を実証し,論文などで成果を発表する予定である.
|