タンパク質の一次構造から機能部位を予測するために、多変量解析を中心とした方法論の研究と、必要なデ-タベ-スの構築を行った。多変量解析の出発点は、アミノ酸配列を単に文字列としてだけでなく、アミノ酸の生物物理化学的性質を反映した数値デ-タの列として表現することである。そのためまず、疎水性などアミノ酸の様々な指標デ-タを文献より集積しデ-タベ-ス化した。さらにクラスタ-分析により指標のクル-プ化を行った。次に、機能部位を構成するアミノ酸配列の特徴を多変量の変数として定義し、判別分析を用いて機能部位を最もよく特徴づける変数の組を選択する方法を開発した。これをタンパク質二次構造領域の予測と、グリコシル化およびリン酸化部位の予測に適用した。また抗原性決定部位についてはデ-タベ-スの構築を重点的に行い、文献に報告されている断片配列がNBRFデ-タベ-スのどのタンパク質のどの部分に相当するか対応づけを行った。これを用いて予測も試みたが十分な精度が得られなかった。多変量解析の方法では表現できるアミノ酸配列の特徴の制約が強すぎることが分かったため、より柔軟な方法として人工知能の方法を取り入れ、エキスパ-トシステムの試作を行った。エキスパ-トシステムは、多変量解析に限らず他の方法の結果も含めて配列デ-タの様々な特徴を統一的に考慮することができる。問題としてはタンパク質の細胞内局在部位の予測をとりあげ、デ-タ集積とエキスパ-トシステムの作成を行った。結論として、本研究で開発した多変量解析の方法は、それ自体でも有効な方法であるが、他の方法と組み合わせることにより、さらに予測精度をあげることができることが分かった。また、実用的な予測システムは、エキスパ-トシステムの形がふさわしいものと考えられる。
|