2017 Fiscal Year Research-status Report
大域的構造抽出と相互作用確率モデルによるタンパク質機能予測法
Project/Area Number |
16K00392
|
Research Institution | Matsue National College of Technology |
Principal Investigator |
林田 守広 松江工業高等専門学校, 電気情報工学科, 准教授 (40402929)
|
Co-Investigator(Kenkyū-buntansha) |
小谷野 仁 東京工業大学, 生命理工学院, 特任助教 (10570989)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 条件付き確率場 / イジングモデル / 文法圧縮 / 一般化series-parallelグラフ / 整数線形計画問題 |
Outline of Annual Research Achievements |
本研究課題の目的の一つであるタンパク質の機能予測手法の開発を促進させるために,タンパク質とRNAとの間の相互作用における条件付き確率場によるタンパク質残基とRNA塩基との間の相互作用確率モデルの改良を行った.アミノ酸残基と塩基との間の相互作用が,隣り合う残基と塩基の相互作用と依存関係があるモデルにおいて,先行研究ではそれぞれの相互作用の有無を特徴ベクトルとしていたところをイジングモデルに似たポテンシャル関数を導入した.先行研究と同じデータセットを用いた検証によって改良モデルは平均AUCを向上させることを確認した.また条件付き確率場の入力として,アミノ酸配列,塩基配列それぞれの多重配列アラインメントから計算した相互情報量を用いていたが,代わりにEkebergらが開発したplmDCAを用いることでさらに予測精度を向上させることを確認した. 細胞内の生体分子間の相互作用ネットワークの構造やタンパク質立体構造を解析するための文法圧縮手法を提案した.これまでの研究では,木構造と見做せる糖鎖などの構造に対して文法圧縮を行うことで構造の解析を行ってきたが,遺伝子制御ネットワークなどの閉路をもったグラフには適用できなかった.一般化series-parallelグラフは木構造の他,外平面グラフ,series-parallelグラフを含むグラフであり,このグラフに対する文法圧縮手法を開発することで,より複雑なネットワーク構造を解析できるようになる.当該年度においては整数線形計画問題への定式化の方策を提案した. この他にタンパク質二量体予測手法にペアワイズカーネルを組み合わせることによる予測手法の改良などを行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
タンパク質の機能予測が本研究課題の目的の一つであり,当該年度においてはそのためにタンパク質とRNAの間の相互作用モデルの改良を行い予測精度の向上を達成した.またタンパク質の立体構造をグラフで表現したときの構造を解析するために,一般化series-parallelグラフに対する分割型文法に基づく圧縮手法を整数線形計画問題に定式化することで提案した.
|
Strategy for Future Research Activity |
タンパク質複合体の予測手法の開発については,ヘテロ二量体に対して幾度かの予測精度の向上を達成してきた.さらなる精度向上を目指すとともに,これに加えてホモ複合体,特にホモ二量体を対象に予測手法の開発を行う. タンパク質アミノ酸残基とRNA塩基の間の相互作用予測については,前年度の国際会議発表でのコメントに基づき,n-gram言語モデルを導入した相互作用モデルを検討する. タンパク質立体構造からの類似部分構造の抽出については,高並列に局所特徴量を計算することで高速に抽出する手法を開発する.
|
Causes of Carryover |
掲載が決定した論文の学術雑誌への掲載料に充てるため.
|
Research Products
(4 results)