研究課題/領域番号 |
26830142
|
研究機関 | 公益財団法人サントリー生命科学財団 |
研究代表者 |
白石 慧 公益財団法人サントリー生命科学財団, その他部局等, 研究員 (50710729)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 相互作用予測 / 機械学習 / 遺伝的アルゴリズム / ペプチド / Gタンパク共役型受容体 |
研究実績の概要 |
本年度は、ペプチド性リガンドの主なターゲットであるGタンパク共役型受容体(GPCR)に限定して機械学習モデルの構築を行った。機械学習を用いてモデルを構築するにあたり、タンパク質・化合物を数値列(記述子)に変換する必要があるが、本研究では、GPCRの記述子にこれまでに研究代表者が開発した幕貫通配列アライメントに基づいた手法を用い、ペプチドにはミスマッチカーネルを用い、それらの直積行列をGPCR-ペプチドペアの記述子とした。しかし、単純な直積カーネルでは、次元数が100万を超え、過学習を起こしてしまうことで、既知情報の多い哺乳類では90%以上の予測精度が得られるにも関わらず、ホヤのGPCR-ペプチド間相互作用の予測精度がTrue Positive Rateで10%以下の予測精度であった。そこで、予定通り、遺伝的アルゴリズムによりそこで、最適な記述子を遺伝的アルゴリズムを用いて取捨選択により生物種特異的な保存残基に左右されない新規相互作用予測器へと改良を行った。遺伝的アルゴリズムで記述子を削減する際には、直積行列すべてに対して計算することは計算資源の問題でむつかしいため、TMカーネルとミスマッチカーネルのそれぞれに対してまず記述子の削減を行い、その後、残ったTMカーネルとミスマッチカーネルの直積行列に対して削減を行う手法をとった。その結果、ホヤにおける既知相互作用を90%以上の精度で予測できる予測器の構築に成功した。また、本年度以降に行う計画であったが、予想以上に予測器の構築が進展したため、構築した予測器を用いて新規相互作用の予測とその活性の検証を行うための実験系を構築した。検証においては、その相互作用の下流を改編し、一意に細胞内カルシウムイオン濃度の上昇で確認可能とするため、GPCR遺伝子の3’末端にGαq15を融合するベクターを構築し、ciGnRHR1及びcionin受容体の活性化をPositive Controlとして確認ている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本年度は≪1.相互作用モデルの構築≫、≪2.遺伝的アルゴリズムを組み込んだ新規相互作用予測器の構築≫の二点を計画していたが、そのどちらも予定以上の予測精度を達成している。特に2の遺伝的アルゴリズムの組み込みでは、大規模なメモリと多CPU機が必要と予想されたが、直積行列の全てに対して計算を行わなくても十分な予測精度を得ることができることが明らかにできた。また、本年度以降の計画であったが、予測器の評価を新規相互作用の検出でもって行うにあたり必要な細胞アッセイ系を事前に構築した。構築したアッセイ系では、GPCR遺伝子の3’末端にGαq15を融合するベクターを構築することで、目的のGPCRの下流シグナルを改編し、一意に細胞内カルシウムイオン濃度の上昇で確認可能なアッセイ系となっている。本手法を来年度以降用いることで当初の想定以上の新規相互作用ペアのアッセイが可能になる。以上の成果から、本年度の進捗は計画以上の進歩があったと考える。
|
今後の研究の推進方策 |
平成26年度に構築した、哺乳類・非哺乳類の既知相互作用を学習したモデルを用い、ホヤの新規ペプチドのGPCRを予測する。予測された各ペプチドのGPCR遺伝子をクローニングし、平成26年度に構築した発現ベクターに挿入することによりHEK293細胞に発現させ、細胞内カルシウムイオンの動員を指標として活性の評価を行う。評価には、当研究室で所有する多検体マルチ機能蛍光プレートリーダー、Flex Stationを用い、96検体が同時に観察することで効率的かつ網羅的に予測器の精度を検証する。活性の評価には、HEK293細胞を用いる。ただし、ホヤは至適温度が18℃であり、HEK293の培養温度(37℃)とかけ離れているためGPCRの変性によりシグナルが検出できない可能性がある。その場合も考慮し、培養温度の低い昆虫細胞での発現系も同時に利用し、アッセイを行う。上記の系で活性が確認されたGPCRについては、Gαq15を融合しない発現ベクターを用い、実際の下流Gタンパク経路の検証を行う。 ただし、検証実験において活性の確認できるペアが発見できない、もしくは著しく確立が低い場合も想定されるが、その場合、検証で間違いであることが分かったペアを順次学習機械に追加し、使用する記述子を再度計算することで、より予測精度の高いモデルを構築していく。
|
次年度使用額が生じた理由 |
遺伝的アルゴリズムの組み込みでは、大規模なメモリと多CPU機が必要と予想されたが、直積行列の全てに対して計算を行わなくても十分な予測精度を得ることができたことから、当初の予定よりも計算用PCの価格を安価に抑えることが可能となったため、本年度使用額が減少した。ただし、予測器の検証のスループットを改善する発現ベクターも準備していることから、来年度以降細胞内カルシウムイオン濃度指示薬を予定以上に使用する予定があることから、本年度の予算の一部を来年度に使用することとした。
|
次年度使用額の使用計画 |
本年度実施予定の細胞内カルシウムイオン濃度の上昇の観察に必要なFlex Station試薬、及びデータのバックアップに必要なPCの購入に充てる予定である。
|