2012 Fiscal Year Research-status Report
Project/Area Number |
24500361
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kyoto University |
Principal Investigator |
林田 守広 京都大学, 化学研究所, 助教 (40402929)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 生体生命情報学 / アルゴリズム / タンパク質 / 機械学習 |
Research Abstract |
これまでの研究において、タンパク質内部のアミノ酸残基間の相互作用を予測するために、画像処理分野で用いられる識別確率場による予測手法を実装し適用した。しかしながら、この識別確率場は画像特有の性質を考慮した確率分布として定式化されている。それ故、タンパク質アミノ酸残基間の相互作用をモデル化するために、より柔軟な条件付き確率場を提案した。さらに以前の研究において用いていた、多重配列アラインメントから得られる各残基間の相互情報量に加えて、各残基がどのアミノ酸をもつかというラベルを条件付き確率場の入力として導入した。タンパク質とRNAの間の相互作用を理解することは生体内のネットワークを解明する上で重要であると考えられる。そこで数種類の相互作用するタンパク質とRNAのペアについて、内部のどのアミノ酸残基とどの塩基が相互作用するのかを、提案した条件付き確率場についてその擬似尤度を最大化することによって予測した。交差検定によって予測精度を検証した結果、アミノ酸と塩基をラベルとして導入した条件付き確率場の方が相互情報量だけのものより精度が向上することが分かった。また物理化学的性質に基づいてアミノ酸を15のグループに分類しラベル付けしたときの方がグループ分けしないときよりも精度が良かった。 タンパク質間相互作用ネットワークからサポートベクターマシンを用いてヘテロ二量体を予測するための特徴ベクトルとタンパク質ドメインに基づくカーネル関数の開発を行った。既知のタンパク質複合体の中での二量体の占める割合は大きいにも関わらず、現在まで有効な手法はほとんど提案されていない。 この他に潜在意味解析と同等であることが知られている非負行列分解を前処理に用いた生存時間分析の手法を提案した。非負行列分解によってうまく分類されなかった患者をノイズとして除くことで良好な結果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
タンパク質は生体の生命維持にとって重要であるだけではなく、様々な生命現象においてその一端を担う。本研究課題の目的は、タンパク質の構造と機能の間の関係の理解を深めるために、共通の機能を示す部分構造のモデル化を行うことと、このモデルを利用した、より高精度の相互作用予測手法を開発することである。 部分構造のモデル化では、当該年度の研究によって、注目するアミノ酸残基に加えて、隣接するアミノ酸残基も含めた残基間相互作用モデルを条件付き確率場によって構成した。物理化学的性質によりグループ分けしたアミノ酸をラベルとして導入することにより、以前の確率モデルよりも精度を向上させた。さらにタンパク質内部の相互作用からタンパク質残基とRNA塩基間に提案モデルを応用した。
|
Strategy for Future Research Activity |
共通の機能を示すタンパク質部分構造のモデル化については、条件付き確率場を用いた予測手法のさらなる精度向上をめざす。条件付き確率場の入力として、多重配列アラインメントからアミノ酸残基間の相互情報量を計算したが、ノイズが大きく大幅な改良が必要である。残基間に相互作用が無いにも拘らず、媒介する残基のために相互情報量が高くなる場合がある。この問題の解決のために背景ノイズの除去や偏相関係数による手法が提案されているが、多重配列アラインメント自体を改良する研究はまだ殆ど無いため、残基間相互作用予測の視点に立ったアラインメントアルゴリズムの開発を行う。 このようなボトムアップの相互作用確率モデルの構築と同時にトップダウンに複数の立体構造から共通する構造パターンを抽出することで構造モデルを構築する。計算量の大きいグラフの同型性を判定する問題に帰着せず、グラフをウェーブレット等を用いて圧縮する方法を考案する。可逆圧縮では困難であるので不可逆圧縮となるが、部分グラフ間の対応を保持しながら圧縮する手法を開発する。
|
Expenditure Plans for the Next FY Research Funding |
タンパク質RNA間相互作用予測の条件付き確率場によるモデル化に関する論文の掲載費用として支出を予定していたが、当該年度内において出版社より請求がなされなかった。次年度において論文掲載費用として使用する予定である。
|
Research Products
(2 results)