研究課題/領域番号 |
20K12048
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東京情報大学 |
研究代表者 |
村上 洋一 東京情報大学, 総合情報学部, 准教授 (20548424)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | バイオインフォマティクス / タンパク質間相互作用予測 / 創薬支援 / 機械学習 / テキストマイニング / タンパク質間相互作用 / タンパク質間相互作用部位予測 / 創薬支援システム |
研究開始時の研究の概要 |
研究代表者がこれまでに開発した,1つのタンパク質の配列情報のみから他のタンパク質と相互作用する部位を予測する手法は,特定のタンパク質との相互作用部位を予測できず,また予測結果から結合に重要なアミノ酸残基の絞り込みが難しい,という課題があった.そこで,機械学習(深層学習)を用いて,2つのタンパク質の配列情報から相互作用部位を予測する手法を開発する.1つの配列のみが与えられた場合は,これと相互作用するタンパク質を予測した後に,これらの相互作用部位を予測するシステムを開発する.さらに予測結果に,配列や構造に関する情報を統合し,結合に重要な残基の絞り込みを支援するウェブアプリケーションを開発する.
|
研究実績の概要 |
現在利用可能なタンパク質構造データからタンパク質上の相互作用部位の情報を網羅的に取得し、各部位のアミノ酸出現パターンや、2つの相互作用面で結合するアミノ酸ペアなどの特徴分析を行った。また、その特徴分析結果に基づき、タンパク質間の相互作用部位を予測する新たな手法の開発を行い、最適化を行っている。また近年、単語や任意の長さの文章を固定長のベクトルに変換することができる分散表現手法であるWord2VecやDoc2Vecがタンパク質間相互作用予測に応用され、その有効性が報告されている。しかしながら、分散表現がタンパク質のどのような特徴を捉え、予測できているのかが不明確である。タンパク質間相互作用部位や相互作用相互作用予測への分散表現の応用可能性を探るために、分散表現とタンパク質の特徴との関係性について理解することが大切であると考えた。そこで、ヒトのタンパク質を対象にして、タンパク質間の分散表現の類似度、配列類似度、構造類似度の比較解析を行った。その結果、特に分散表現の類似度と構造類似度に相関があることが確認された。現在、相関が最も高いときの分散表現の各種パラメータ(k-mer、window_size, vector_size)の値を用いて作成した分散表現モデルを用いることで、タンパク質間相互作用予測の精度を向上できるのか検証している。さらに、タンパク質の分散表現や位置特異的スコア行列(PSSM)のベクトル表現、またその他の特徴を用いて、深層学習に基づく新たなタンパク質相互作用予測手法を検討している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
令和4年度は網羅的に収集した多様な相互作用部位の特徴分析を完了し、タンパク質間の相互作用部位(他のタンパク質と相互作用する可能性が高いアミノ酸や、与えられたタンパク質間で結合する可能性が高いアミノ酸ペア)を予測する方法の開発を行った。また近年注目されている分散表現手法のタンパク質間相互作用予測への有効性を検証するために、既知のタンパク質の分散表現の類似度、配列類似度、構造類似度の比較解析を行った。この比較結果に基づく、タンパク質相互作用を予測する新たな手法の検討を行っている。予測相互作用相互作用予測から相互作用部位予測までを行うパイプラインの開発に着手することができなかった。
|
今後の研究の推進方策 |
与えられたタンパク質と相互作用するタンパク質を予測する手法の高精度化に取り組み、相互作用相互作用予測後に相互作用部位予測を行うパイプラインの開発を令和5年度内に完了できるように進める。また上記の開発と並行して、予測結果に付加する配列や構造に関する情報について引き続き検討していく計画である。
|