研究課題/領域番号 |
15F15080
|
研究機関 | 東京農工大学 |
研究代表者 |
黒田 裕 東京農工大学, 工学(系)研究科(研究院), 准教授 (10312240)
|
研究分担者 |
TAMBI RICHA 東京農工大学, 工学(系)研究科(研究院), 外国人特別研究員
|
研究期間 (年度) |
2015-07-29 – 2017-03-31
|
キーワード | タンパク質ドメイン / 構造予測 / 機械学習 / サポートベクターマシン |
研究実績の概要 |
本年度の研究では、構造及び機能未知の新規タンパク質のドメイン領域をそのアミノ酸配列から推定する予測機を開発した。本研究は、受入れ研究者が以前に開発したタンパク質のドメイン間でヘリックス構造を形成する5から20残基のドメイン境界領域(以下、ヘリカルリンカー)を予測する研究に基づく。受入れ研究者が先行研究で開発した手法は、機械学習の一種であるサポートベクターマシン (Support Vector Machine;SVM)にヘリカルリンカー配列の特徴を学習させ、予測機として利用することである。既存の予測機では、配列特徴が弱いヘリカルリンカーの検出に、配列類似性情報(具体的にはPSSM)を多く用いている。そのため、予測効率は高いが、計算速度が遅かった。そこで、本計画では、機械学習に用いるヘリカルリンカー・データベースを再構築し、PSSMの計算を軽減してSVMの学習を行った。その結果、従来とほぼ同じ予測効率を有しながら、計算速度が5倍以上高速化した新規のヘリカルリンカー予測機を開発した。本方法を用いると、ランダム選択又は二次構造予測情報からドメイン境界を予測したときより2倍から3倍高い予測効率で、ドメイン境界を数秒で同定できるようになった。このようなドメイン境界予測機は、脳タンパク質など大きなタンパク質の解析を支援するツールとして期待が集まっており、プロテオーム解析への応用において重要な意味を持つ。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
おおむね順調に進行していると評価する。当初は神経ペプチド(NP)の配列データベース(以下DB)を構築し、DBに含まれる配列情報を機械学習してアミノ酸配列からNP領域を同定する予測機を開発することを目的としていた。しかし、計画を開始したところ、計画申請時には存在しなかったNP配列を収集したDBが発表されていることが判明した。そのため、研究の対象をNPから複数のドメインを含む多ドメインタンパク質に修正した。修正後は、多ドメインタンパク質のDBを作成し、配列特徴を機械学習させるなど、計画は順調に進行した。 結果的に、解析対象を修正したことで、研究が発展し、比較的短期間で成果を挙げることに成功したと考えている。研究成果は1報の英文査読付き学術論文と2回の国内学会で発表した。
|
今後の研究の推進方策 |
上記の通り本研究の内容はすでに発表しており、ドメイン境界の予測システムはインターネット公開している。さらに、研究で作成したヘリカル・ドメインのデータセットも現在では自由にダンロードできる状態にしている。 今後は、NPの一つである膵島アミロイドポリペプチド(IAPP;37残基)の物性及びアミロイド形成能を生物情報学的な手法を用いて解析する予定である。計画では、37残基の膵島アミロイドポリペプチド(IAPP)のうち23~29番目の残基に対応するペプチド断片(FGAILSS)がアミロイド形成能を持つことに注目し、理化学研究所QBiCと共同でIAPPのペプチド断片を複数ランダム配置した系の全原子分子動力学シミュレーションを実施する。最大27本のペプチドがアミロイド構造を形成する過程を観測するという、世界に先立つシミュレーションを実施し、その結果を現在までに報告されている実験結果と比較することで、シミュレーションによってペプチドのアミロイド形性が再現できるかを解明する計画である。
|