2003 Fiscal Year Annual Research Report
バイオインフォマティクスのための共通パターン抽出アルゴリズムの研究
Project/Area Number |
13680394
|
Research Institution | Kyoto University |
Principal Investigator |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
Co-Investigator(Kenkyū-buntansha) |
上田 展久 京都大学, 化学研究所, 助手 (80346048)
宮野 悟 東京大学, 医科学研究所, 教授 (50128104)
|
Keywords | カーネル法 / サポートベクタマシン / ローカルアライメント / ホモロジー検索 / 点集合 / 合同性判定 / 最大共通部分点集合 / 近似マッチング |
Research Abstract |
本年度は以下の2種類のテーマを中心に研究を行った。 (1)配列分類のためのカーネル法の開発 タンパク質配列から共通部分を抽出するためには、タンパク質の類似性を検出することが必要である。強い類似性については配列アライメントという従来手法で検出することができるが、弱い類似性の検出については確立した手法がない。一方、最近になり、配列間の類似性を測るカーネル関数を定義し、それに基づきサポートベクタマシンを適用することに弱い類似性を検出しようという研究が行われるようになった。そこで本研究においては、配列アライメントにおいて広く利用されているローカルアライメントに基づくカーネル関数を開発した。ただし、ローカルアライメントをそのまま用いたのではカーネル関数としての数学的性質を満たさないため、ペアHMMという確率モデルを用いてローカルアライメントと似た計算を行うカーネル関数を開発した。ベンチマークデータを用いて開発したカーネル関数と既存のカーネル関数との比較を行った結果、既存のカーネル関数より良好な分類精度を得ることができた。 (2)差異の小さな点集合に対する幾何的マッチングアルゴリズム 点集合の合同性判定問題や最大共通部分点集合問題はタンパク質立体構造や二次元電気泳動画像の比較などと関連する基本的な幾何学的パターンマッチング問題である。しかしながら、これらの問題の時間計算量には現在のところ、大きなギャップが存在する。そこで、両者の問題の中間的な問題として、二つの点集合の差異が小さな場合の最大共通点部分集合について理論的考察を行い、効率的なアルゴリズムを開発した。このアルゴリズムでは、文字列の近似マッチングに用いられる手法を幾何図形のマッチングに初めて適用したところに特徴があり、合同性判定よりは効率が悪いが、一般の最大共通部分点集合問題に対するアルゴリズムよりは効率の良いものとなっている。
|
Research Products
(5 results)
-
[Publications] T.Akutsu, K.Kanaya, A.Ohyama, A.Fujiyama: "Point matching under non-uniform distortions"Discrete Applied Mathematics. 127. 5-21 (2003)
-
[Publications] T.Akutsu, S.Kuhara, O.Maruyama, S.Miyano: "Identification of genetic networks by strategic gene disruptions and overexpressions under a Boolean model"Theoretical Computer Science. 298. 235-251 (2003)
-
[Publications] D.Shinozaki, T.Akutsu, O.Maruyama: "Finding optimal degenerate patterns in DNA sequences"Bioinformatics. 19・Suppl.2. ii206-ii214 (2003)
-
[Publications] N.Hayashida, N.Ueda, T.Akutsu: "Inferring strengths of protein-protein interactions from experimental data using linear programming"Bioinformatics. 19・Suppl.2. ii58-ii65 (2003)
-
[Publications] H.Saigo, J-P.Vert, N.Ueda, T.Akutsu: "Protein homology detection using string alignment kernels"Bioinformatics. (in press). (2004)