2015 Fiscal Year Annual Research Report
Project/Area Number |
24500361
|
Research Institution | Kyoto University |
Principal Investigator |
林田 守広 京都大学, 化学研究所, 助教 (40402929)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | タンパク質相互作用強度 / オンライン学習 / 中央文字列 / 中心文字列 / 整数計画法 |
Outline of Annual Research Achievements |
本研究課題の目的の一つであるタンパク質の相互作用予測手法について,これまで開発してきた手法よりも高精度の相互作用の強度を予測する手法を開発した.タンパク質のアミノ酸配列とドメイン領域の情報から得られる特徴ベクトルを利用し,教師付きの回帰問題としてオンライン学習手法であるPassive-aggressive法の回帰版とARCOR法に基づく手法を提案した. またタンパク質アミノ酸配列の機能分類や進化解析等を目的とした,複数の文字列から中央文字列および中心文字列を求める厳密解法を提案した.文字列間の距離としては進化解析において重要な,置換,挿入,削除の操作をもつレーベンシュタイン距離を用いた.中央文字列は入力文字列からの距離の和が最小となる文字列として定義され,中心文字列は入力文字列からの距離の最大を最小とする文字列として定義される.それぞれを整数計画問題へ定式化することで,中央文字列については既存手法よりも効率の良い手法を開発した.中心文字列の厳密解法についてはこれまで開発されていなかった. 当該年度にはこの他にも,条件を満たす木状化合物の全列挙における深さ優先探索の並列化による高速化を論文としてまとめるとともに,環構造としてベンゼン環,ナフタレン環を含む化合物の列挙アルゴリズムを開発した. 本研究課題においてタンパク質立体構造間の類似度については,画像認識に使用される高速で高性能な局所特徴量に基づく類似度指標を提案し,これまで開発してきた手法よりも立体構造の分類精度が向上することを確認した.さらにアミノ酸残基単位での相互作用予測に対してはRNA塩基との条件付き確率場モデルを提案し,タンパク質複合体予測手法の開発についてはヘテロ二量体,三量体において既存手法よりも優れたカーネル関数を用いた予測手法を提案した.
|