研究概要 |
本研究は,高精度なリガンド予測を実現するために記述子を自動獲得することを目的とする.ターゲットと相互作用するリガンドを予測するには効果的な記述子が重要となる.大域的モデルでは,各々のターゲットに特化した記述子を扱うことができないが,局所的モデルでは少サンプル問題が起因して十分な汎化能力が得られないことが多々ある.本研究は,転移学習の考え方を導入して,この2つの問題を同時に解決するアルゴリズムを開発した. 転移学習アルゴリズムは高い汎化能力を有するサポートベクトルマシンという予測モデルを拡張して開発した.本研究で開発したアルゴリズムでは,タスク間ネットワークによって既定されているタスク間にモデルパラメータ間の類似性を持たせるトリックを用い,類似タスクの同時学習を実現した.局所モデルのための記述子を得るために,非線形合成を行った.非線形合成を行うために,化学的空間と相互作用空間を導入した.各々のデータの化学的プロファイルと相互作用プロファイルはそれぞれの空間にある.これらのプロファイルを合成空間に線形射影する.本研究では,局所的記述子を得るために,プロファイル間の類似性から導出される重みつき経験分布を導入して,その経験分布に基づく期待ユークリッド距離が最小になるような射影を計算するようにした.これは一般化固有値問題に帰着され最適解が保証される.このアルゴリズムはカーネル化できるため,最適な非線形合成を求めることができる.さらに重みつき経験分布に適合するような学習を行う拡張サポートベクトルマシンアルゴリズムを開発した. 開発したアルゴリズムの性能評価はP450アイソザイムおよび嗅覚受容体データを用いて行った.ROCカーブに基づくAUCおよびF-measureを用いて汎化性能の評価を行ったところ,どちらの指標においても従来の手法を大きく上回る予測性能を得ることができた.
|