研究課題/領域番号 |
13680394
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
計算機科学
|
研究機関 | 京都大学 |
研究代表者 |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
研究分担者 |
宮野 悟 東京大学, 医科学研究所, 教授 (50128104)
上田 展久 京都大学, 化学研究所, 助手 (80346048)
|
研究期間 (年度) |
2001 – 2003
|
研究課題ステータス |
完了 (2003年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,600千円)
2003年度: 1,000千円 (直接経費: 1,000千円)
2002年度: 700千円 (直接経費: 700千円)
2001年度: 900千円 (直接経費: 900千円)
|
キーワード | バイオインフォマティクス / パターンマッチング / 配列モチーフ / アルゴリズム / カーネル法 / 位置依存スコア行列 / 局所アライメント / サポートベクタマシン / ローカルアライメント / ホモロジー検索 / 点集合 / 合同性判定 / 最大共通部分点集合 / 近似マッチング / モチーフ抽出 / 最大クリーク / 電気泳動 / スポットマッチング / 構造アライメント / GIBBSサンプリング / 相対エントロピー / ローカルサーチ |
研究概要 |
大量かつ多様な生物情報データから有用な情報を抽出するためには、共通の生物学的性質をもつ遺伝子群やタンパク質群が与えられた時に、対応するDNA配列群や立体構造群から共通のパターンを検出するという方法が有効である。この共通パターン抽出問題に対して様々な観点から研究を行った。以下に主要な結果について示す。 1.局所アライメントによる共通配列パターン抽出:配列データからのモチーフ抽出において広く利用されているGibbs Sampling法を数値データに適用できるように拡張し、タンパク質立体構造からのモチーフ(共通パターン)抽出に適用した。 2.正負の例からの配列パターン抽出:正負の配列データからそれらを正しく分類する位置依存スコア行列(PSSM)を推定する問題の計算量について理論的解析を行った。 3.電気泳動画像およびタンパク質立体構造のパターンマッチング:DNA二次元電気泳動画像のスポットマッチング問題を幾何的なマッチング問題として定義し、そのNP困難性を証明した。一方、この問題とタンパク質立体構造のマッチング問題に対し、これらを最大クリーク問題に帰着することにより最適階を計算する実用的な手法を開発した。 4.カーネル法に基づく配列分類:タンパク質配列の高精度な分類のために、配列比較において広く利用されているローカルアライメントに基づくカーネル関数を開発した。サポートベクタマシンと組み合わせた計算機実験により、既存手法を上回る分類精度が得られることを確認した。 5.線形計画法に基づくタンパク質相互作用推定:この問題を線形計画問題として定式化することによりドメイン間の相互作用パターンを抽出する手法を開発した。計算機実験を行った結果、相互作用頻度データをもとに推定を行った場合には既存手法を大きく上回る予測精度を得ることができた。
|