1989 Fiscal Year Annual Research Report
アミノ酸配列の多変量解析によるタンパク質機能部位の予測
Project/Area Number |
63480514
|
Research Institution | KYOTO UNIVERSITY |
Principal Investigator |
金久 實 京都大学, 化学研究所, 教授 (70183275)
|
Keywords | タンパク質の機能予測 / 多変量解析 / エキスパ-トシステム |
Research Abstract |
前年度に引き続きタンパク質の一次構造から機能部位を予測するための方法論の研究とデ-タ-の集積を行った。方法論としては判別分析を中心とした多変量解析をさらに発展させ、人工知能的な方法としてエキスパ-トシステムの試作を行った。それは、アミノ酸配列の様々な特徴を多変量の変数として定義し、判別分析により最適の変数の組を選択する前年度のやり方では、表現できる特徴の制約が強すぎることが分かったからである。多変量解析に限らず、他の方法の結果も含めて、タンパク質の機能部位を予測するには、もっと柔軟なアプロ-チが必要であり、人工知能の方法がその枠組みを提供する。そこで、タンパク質の細胞内局在部位予測の問題をとりあげ、デ-タ-集積とエキスパ-トシステムの試作を行った。まずグラム陰性菌の場合は、ソ-ティングの候補場所として細胞質、内膜、ペリプラズム、外膜の4種類を考えた。結果として、我々のデ-タ-ベ-スに対して、83%の精度で予測が可能であった。ペリプラズムのタンパク質と外膜のタンパク質を区別するためのシグナルはこれまで知られていなかったが、多変量解析によりアミノ酸組成の違いによってかなり正確に区別できることが分かった。次に真核細胞の場合は、ソ-ティングの候補場所として細胞質、ミトコンドリア、核、ベルオキシソ-ム、小胞体、原形質膜、細胞外を基本に、植物細胞の場合はさらに候補として葉緑体も加えた。結果としては現在のところ、76%の予測精度が得られている。結論として、本研究で開発した多変量解析の方法は、それ自体でも有効な方法であるが、他の方法と組み合わせることにより、さらに予測精度をあげることができることが分かった。また、実用的な予測システムは、エキスパ-システムの形がふさわしいものと考えられる。
|
Research Products
(5 results)
-
[Publications] Nakata,K.,Kanehisa,M.,and Maizel,J.V.,Jr.: "Discriminant analysis of promoter regions in E.coli sequences." Comp.Appl.Biosci.4. 367-371 (1988)
-
[Publications] Kanehisa,M.: "A multivariate analysis method for discriminating protein secondary structural segments." Prot.Eng.2. 87-92 (1988)
-
[Publications] Nakai,K.,Kidera,A.,and Kanehisa,M.: "Cluster analysis of amino acid indices for prediction of protein structure and function." Prot.Eng.2. 93-100 (1988)
-
[Publications] Nakai,K.and Kanehisa,M.: "Prediction of in-vivo modification sites of proteins from their Primary structures." J.Biochem.104. 693-699 (1988)
-
[Publications] Seto,Y.and Kanehisa,M.: "Repeat sequences of amino acids suggest the origin of protein." Bull.Inst.Chem.Res.,Kyoto Univ.66. 461-468 (1989)