研究課題/領域番号 |
20K12048
|
研究機関 | 東京情報大学 |
研究代表者 |
村上 洋一 東京情報大学, 総合情報学部, 准教授 (20548424)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | バイオインフォマティクス / タンパク質間相互作用 / タンパク質間相互作用予測 / 機械学習 / 創薬支援 |
研究実績の概要 |
研究代表者がこれまでに開発したタンパク質間の相互作用部位予測法(PSIVER)の学習データセットは、ヘテロ二量体構造の相互作用部位の特徴情報のみから作られていたが、これら以外のヘテロ多量体構造の相互作用部位の特徴情報を取りこぼしてしまっていた。令和3年度は、さまざまな種の多様な構造の相互作用部位の特徴情報を取りこぼしなく学習データセットに含めるために、研究代表者が先行研究で開発した、既知のタンパク質構造情報を統合してタンパク質上のリガンド結合部位の情報を網羅的に取得するためのツールを応用して、タンパク質間の相互作用部位の情報を網羅的に取得し、これらのデータをNoSQLデータベースであるMongoDBにJSON形式で保存した。そしてこのデータベースを用いて、2つのタンパク質のアミノ酸配列から相互作用部位を予測する方法の開発に必要な学習データセットの候補となるデータを絞り込み、それらの相互作用部位の特徴分析を行っている。また、一部の学習データセットを用いて、深層学習モデルの作成や深層学習のパラメータを最適化する一連の処理を自動的に実行するプログラムを作成している。一方、与えられたタンパク質と相互作用するタンパク質(相互作用パートナー)を予測する手法の高精度化を目指して、任意の長さの文章を固定長のベクトルに変換することができる手法を用いてアミノ酸配列を分散表現し、構造や機能との関係性について分析を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
令和2年度から引き続き、与えられた2つのタンパク質間の相互作用部位をより精度良く予測する方法の開発を行っており、令和3年度は多様な相互作用部位の特徴情報を含めた学習データセットの作成、それらの特徴分析、深層学習のための準備を行った。また与えられたタンパク質と相互作用するタンパク質(相互作用パートナー)を予測する手法の高精度化に関する研究にも着手した。しかしながら、新型コロナウイルス感染症の影響による遅れを取り戻すことはできず、相互作用パートナー予測から相互作用部位予測までを行うパイプラインの開発に着手することができなかった。
|
今後の研究の推進方策 |
令和2年度からの研究の遅れを取り戻すため、作成した学習データセットを用いて相互作用部位予測のための深層学習モデルの構築とその性能評価を早急に実施する。また、与えられたタンパク質と相互作用するタンパク質を予測する手法の高精度化に取り組み、相互作用パートナー予測後に相互作用部位予測を行うパイプラインの開発を令和4年度内に完了できるように進める。また上記の開発と並行して、予測結果に付加する配列や構造に関する情報について引き続き検討していく計画である。
|
次年度使用額が生じた理由 |
(理由) 国内外での情報収集のための学会や研究会への参加や発表がオンラインになり、旅費交通費が発生せず、また新型コロナウイルス感染症の影響により研究計画に遅れが生じてしまったため、予定していた論文投稿費が発生しなかったため。 (使用計画) 本研究では2つの予測法を1台の高性能なPC上で実行することを予定していたが、PCへの負荷を分散するため別々のPC上で実行するように変更するため高性能なPCを1台購入する。また、学会や研究会等への参加費、旅費、論文投稿費等として使用する。
|