1995 Fiscal Year Annual Research Report
タンパク質細胞内局在部位予測知識ベースシステムの改良・発展
Project/Area Number |
07249205
|
Research Institution | Osaka University |
Principal Investigator |
中井 謙太 大阪大学, 細胞生体工学センター, 助教授 (60217643)
|
Keywords | 配列解析 / 知識ベース / 確率推論 / タンパク質 / 細胞内局在化 / ミトコンドリア移行シグナル |
Research Abstract |
本研究では、タンパク質の細胞内局在部位予測システムPSORTを最新のデータや知見に基づいて改良することを目標にした。タンパク質の局在化シグナルは、たいていぼんやりとした一次配列上の特徴しか備えていないので、予測に際しては推論全体のバランスを考慮しなければならないが、この特徴は現在のPSORTシステムが“if-then"型の知識ベース構成をしていることにとって不利である。そこで、多少の推論の融通性は犠牲にしても、全体の見通しがよく、パラメータ調整も容易なモデルとして、J. Pearlらの確率推論の考え方を推論木による分類問題に適用したモデルを作った。これを酵母データに適用した場合、予測能力については、クロス検証や冗長データ除去を行ってもほとんど学習データの結果とかわらないという良好な結果が得られた。 一方、推論木に与えられる予測変数自体を改良するために、判別分析法を用いたミトコンドリア移行シグナル検出法の改良に取り組んだ。いろいろな変数の中から変数選択法によって判別分析を行ったところ、平均で92.4%予測ができた。10回のテストで、常に選ばれた変数は、Arg(N末20アミノ酸中含量),75度の疎水性モーメント,Gly,酸性アミノ酸,Ser/Thrであった。 新しい推論モデルの採用により、簡単にシステムのパラメータを決定できるようになったので、従来は不可能であったクロス検証法による予測能力の評価が可能になった。反面、曖味なルールや例外的なルールを取り入れるのがやや難しくなったため、近々予定しているシステムの全面改訂に向けて、知識全体を今一度見通しよく整理する必要に迫られている。また、ミトコンドリア移行シグナルの予測について、従来より優れた変数が得られた。結果を見ると、塩基性のアミノ酸の重要性がいわれているわりには、Lys残基頻度が判別に無力なのは意外であった。
|
Research Products
(1 results)