2006 Fiscal Year Annual Research Report
Project/Area Number |
16300092
|
Research Institution | Kyoto University |
Principal Investigator |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
Co-Investigator(Kenkyū-buntansha) |
林田 守広 京都大学, 化学研究所, 助手 (40402929)
宮野 悟 東京大学, 医科学研究所, 教授 (50128104)
丸山 修 九州大学, 大学院数理学研究院, 助教授 (20282519)
|
Keywords | 特徴ベクトル / 木構造 / 平面的グラフ / オイラー文字列 / 編集距離 / クラスタリング / タンパク質配列 / 生物情報ネットワーク |
Research Abstract |
本基盤研究では本年度、主に以下の三種類のテーマに関して研究を行った:1.特徴ベクトルからのグラフ構造の推定法、2.木構造の比較アルゴリズム、3.グラフの極大成分を用いたネットワークのクラスタリング手法。 1.パスの出現頻度に基づく特徴ベクトルからのグラフ構造の推定法は平成17年度より開始した研究テーマであり、新規な化学構造を見出すために有用であると考えられる。平成17年度の研究においては、パスの頻度からなる特徴ベクトルから木構造を推定するアルゴリズムを開発したが、平成18年度は、この結果を、小さな部分構造の出現頻度からなる特徴ベクトルから木構造および外平面的グラフ構造を持つ化学構造を推定するように拡張した。また、実際に動作するアルゴリズムの開発も行い、分枝限定法を用いて、パスの出現頻度からなる特徴ベクトルから木に似た構造を持つ化学構造を推定するアルゴリズムを開発した。そして、計算機実験により、(水素原子を除いて)十数原子からなる化合物の推定に適用できることを示した。 2.木構造の編集距離をオイラー文字列の編集距離を用いて高速に近似するアルゴリズムを平成17年度に開発した。しかしながら、木の高さが大きい場合には意味のある近似精度が得られないという欠点があった。そこで、オイラー文字列に部分木の情報を巧妙に埋め込むことにより、木の高さが大きい場合にも近似精度を保証できるアルゴリズムを開発した。 3.代謝ネットワーク、タンパク質相互作用ネットワーク、遺伝子ネットワークなどの生物情報ネットワークデータから、グラフをクラスタリングすることによりデータを分類することはバイオインフォマティクスにおける重要な問題である。これまでに様々な方法が提案されてきたが、グラフの構造に深く着目した研究はあまり行われてこなかった。そこで、本研究では、辺連結度をもとに定義されるグラフの極大成分に基づく階層的クラスタリング手法を、生物情報ネットワークに適用する手法を開発した。開発した手法をタンパク質配列の類似度を辺の重みとするネットワークのクラスタリングに適用したところ、最短距離法、群平均距離法をいった従来手法と比較し、より良好な結果を得ることができた。
|
Research Products
(7 results)