研究概要 |
本研究は,生体ネットワークを計算機により自動予測することを目的としている.ここでタンパク質ネットワークを定義しておく.ネットワークのノードは一つのタンパク質を表し,2つのノードを繋ぐエッジは対応するタンパク質間に何らかの関係があることを意味している.たとえば,タンパク質ネットワークの一種であるタンパク質相互作用ネットワークはタンパク質間の物理的な相互作用を表したネットワークである.この相互作用ネットワークをマッピングするための技術として最初に試みられた方法論は酵母ツーハイブリッド法である.この手法はタンパク質の相互作用を統一的にかつハイスループットにとらえる技術として広く普及している.この手法の最大の利点は,取り扱いの厄介なタンパク質を直接操作するのではなく,大量の相互作用候補のスクリーニングできることである.実際に,UetsらとItoらによって酵母の全ORF約6000個を総当りに解析された.しかし,両者の出した相互作用の共通部分は133個しかなく,より精度の高い技術の開発と実験が要求されている.そのほかのタンパク質ネットワークとして酵素のネットワークがある.酵素ネットワークは代謝ネットワークの酵素反応を表したネットワークである.代謝ネットワークは化学低分子とその反応に関わる酵素となるタンパク質からなる.近年では,KEGG/PATHWAYやEcoCycのような代謝経路データベースが発達し,そこから既知の代謝ネットワークを得ることができるようになった.ところが,多くのプロジェクトでは興味のある代謝経路に的を絞って解析しているため,未知の代謝ネットワークが多く残されている.さらに既知のネットワークであったとしても多くの酵素が不明のままである. 平成18年度は,そのような生体ネットワークにおけるエッジの有無を自動的に予測する算法を開発した.近年,情報科学の分野における最適化問題を効率的に解く数値計算法の研究が発展し,二次錐計画問題と呼ばれるクラスの最適化計画を高速に解く方法が確立されつつある.本研究では,教師となるデータを1クラス分類問題をネットワーク推定問題に帰着させ,これをSVMなどで用いられているヒンジロスを使って目的関数を構成した.このロス関数がデータを選択的に統合する役割を果たす.これをカーネル行列で表現されているデータに適用できるように双対問題をラグランジェ乗数法によって導出した.この双対問題は一見最適化困難にみえるものになっている.これをさらに変形して等価な行列分数計画問題を導いた.行列分数計画問題は二次錐計画問題に変形可能であるので,この事実を使って,本研究で定式化したネットワーク推定問題の最適化算法を開発した.
|