研究課題/領域番号 |
16014211
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
生物系
|
研究機関 | 京都大学 |
研究代表者 |
馬見塚 拓 京都大学, 化学研究所, 客員助教授 (00346107)
|
研究分担者 |
山口 敦子 京都大学, 化学研究所, 客員助手 (10346108)
|
研究期間 (年度) |
2004
|
研究課題ステータス |
完了 (2004年度)
|
配分額 *注記 |
6,500千円 (直接経費: 6,500千円)
2004年度: 6,500千円 (直接経費: 6,500千円)
|
キーワード | アルゴリズム / 機械学習 / 生体生命情報学 / プロテオーム |
研究概要 |
比較・探索アルゴリズムに関しては、まず生体内化合物の二次構造を分子グラフとみなしグラフの複雑さの尺度に着目した。特に木幅(tree-width)と全域木の数に注目した。二つの化合物を比較する際に一方の化合物の木幅に上限がありもう一方の化合物の全域木の数が化合物の原子数の高々多項式であるという問題設定において効率的なアルゴリズムを開発した。この結果はInformation Processing Letters誌に投稿・受理された。実際に、生体内化合物の木幅は高々4であり、また全域木の数も次数5程度の多項式で済むことを確かめた。さらに、木幅を生体内化合物の一つの属性とみなした場合に、代謝パスウェイや酵素の分類等の生体内化学反応と木幅の相関関係についても調べ、これらすべての結果をまとめた論文を準備中である。さらに、比較・探索アルゴリズムに関しては、順序なし木とみなした糖鎖の効率的な比較・探索を行うツールKCaMを開発・実装し、京都大学バイオインフォマティクスセンターのKEGG内で糖鎖DB、GLYCAN内の糖鎖比較・探索サービスを開始した。この結果は、NAR誌に投稿・受理された。発見アルゴリズムに関しては、順序木とみなした糖鎖のための確率モデルと効率的なパラメータ推定手法を構築・実装した。この手法は順序木のための最初の確率モデルであり、より一般的なベイジアンネットワークの既存のパラメータ推定手法に較べて提案学習手法ははるかに効率的である。この手法の糖鎖への適用により糖鎖の特徴的なパターンを抽出した結果を含めて、ISMBやSIGMOD Record誌等に投稿し受理された。さらに、代謝パスウェイをマルコフモデルとみなしマイクロアレイデータからパラメータ推定を行い、遺伝子発現の観点から有効な代謝パスを推定する手法を構築し、実データによる検証結果をCSBに投稿・受理された。
|