2008 Fiscal Year Annual Research Report
木確率モデルを用いた知識発見よりのタンパク質の糖鎖認識部位予測
Project/Area Number |
20016025
|
Research Institution | Soka University |
Principal Investigator |
木下 聖子 Soka University, 工学部, 工学部 (50440235)
|
Keywords | 機械学習 / 糖鎖 / 確率モデル / 認識部立予測 |
Research Abstract |
Profile PSTMMのモデルの最も重要な問題点は入力された糖鎖構造に適応するState Modelを確定することであった。このモデルはState Modelの形に添ってプロファイルを出力する。そのため、入力された糖鎖構造に対してState Modelの形が不適切であると、不正確なプロファイルを出力する可能性が生じる。この改善のために、初めに入力された糖鎖構造を用いて全対全の最大共通部分を取得し、State Modelの形を確定することが出来る。しかしながら、入力された糖鎖構造の数によって、最大共通部分木が小さくなる傾向が認め照れた。そのため、更に適切なState Modelの確定法の研究を進め、糖鎖の多重配列アラインメントか照のブロックを抽出するアルゴリズムを開発した。糖鎖のブロックは、多重配列アライメントから得たギャップのないモチーフ構造を示す。糖鎖ブロックを決定することによってState Modelの構造を決め照れると考え、まずアミノ酸配列のマルチプルアライメントアルゴリズムCLUSTALWを基に、糖鎖構造のアルゴリズムMCAW(Multiple Carbohydrate Alignment with Weights)を考えた。このアルゴリズムでは糖鎖の類似性から案内木を作成し、有根木に変換する際に重み付けをする。そして、案内木に従って各糖鎖をマルチプルアライメントに追加して行き、重みをスコアの計算で用いることで、糖鎖のブロックを作成することができる。この糖鎖ブロックか照適切なState Modelを構築できると考え照れた。また、糖鎖構造の多重配列アライメントを行うための形式も決める必要があったため、PKCF(Profile KCF)と呼ぶ新しい糖鎖アライメント形式も開発した。そして、この形式を扱うことができるMCAWのプログラムを開発した。
|