2002 Fiscal Year Annual Research Report
バイオインフォマティクスのための共通パターン抽出アルゴリズムの研究
Project/Area Number |
13680394
|
Research Institution | Kyoto University |
Principal Investigator |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
Co-Investigator(Kenkyū-buntansha) |
上田 展久 京都大学, 化学研究所, 助手 (80346048)
宮野 悟 東京大学, 医科学研究所, 教授 (50128104)
|
Keywords | モチーフ抽出 / 位置依存スコア行列 / 最大クリーク / 電気泳動 / スポットマッチング / 構造アライメント / パターンマッチング / アルゴリズム |
Research Abstract |
本年度は以下の二種類の成果をあげることができた。 1.効率的最大クリークアルゴリズムを用いた電気泳動画像およびタンパク質立体構造のパターンマッチング DNA二次元電気泳動画像のスポットマッチング問題、タンパク質立体構造の構造アライメント問題はいずれもある定式化のもとでNP困難であることが知られている。一方、電気通信大学の富田らはNP困難問題である最大クリーク問題に対し、効率的なアルゴリズムを開発した。そこで、上記二種類の問題を点集合のマッチング問題として定義し、さらにその問題を最大クリーク問題に帰着し、富田らのアルゴリズムを適用することにより最適解を計算する手法を開発し、さらにクリーク問題に帰着する前に不要な頂点や枝を削除するための前処理法も開発した。実データを用いた計算機実験の結果、サイズ(点の個数)が100〜200程度であれば最適解を計算できることが判明した。 2.複数の位置依存スコア行列の正負例からの同時推定の計算量の解析 平成13年度に正例(あるパターンを含む配列)と負例(パターンを含まない配列)から、位置依存スコア行列と呼ばれるパターンを特徴づけるデータ構造を推定する問題について研究を行ったが、それをさらに発展させ、パターンが複数のパターンの和集合で表される場合に、対応する複数の位置依存スコア行列を推定する問題について研究を行った。その結果、位置依存スコア行列の個数を最小化する問題はグラフ彩色問題以上に近似が困難であることが判明した。また、この問題と深い関係のある「例からの半平面の和集合の推定」という問題についても研究を行い、同様の下限や二次元の場合の多項式時間アルゴリズムを得た。
|
Research Products
(4 results)
-
[Publications] T.Akutsu, H.Bannai, S.Miyano, S.Ott: "On the complexity of deriving position specific score matrices from examples"Lecture Notes in Computer Science. 2373. 168-177 (2002)
-
[Publications] T.Akutsu, S.Ott: "Inferring a union of halfspaces from examples"Lecture Notes in Computer Science. 2387. 117-126 (2002)
-
[Publications] K.C.D.Bahadur, T.Akutsu, E.Tomita, T.Seki, A.Fujiyama: "Point matching under non-uniform distortions and protein side chain packing based on an efficient maximum clique algorithm"Genome Informatics. 13. 143-152 (2002)
-
[Publications] T.Akutsu, S.Miyano, S.Kuhara: "A simple greedy algorithm for finding functional relations : efficient implementation and average case analysis"Theoretical Computer Science. 292. 481-495 (2003)