研究概要 |
本研究の当初目標は、糖鎖データベースから特徴的な構造パタンを抽出するマイニング手法を開発し、糖鎖構造と機能の解明に寄与することとした。しかしながらアルゴリズムの開発が困難であったため、ネットワーク構造の解析, 及び、その機能の解析のための新たな手法の開発を行うことを新たな目標とした。この目標に対して(1)糖鎖関連パスウェイ解析、及び、(2)糖鎖遺伝子解析を容易にする手法の研究開発を行った。 (1) グラフノードクラスタリングの新たな統計モデルの構築を行った。従来法は最適なクラスタ数の決定問題やスケーラビリティに関する問題、あるいは統計モデルの場合、クラスタ内でエッジが密・クラスタ間でエッジが疎となるクラスタが必ずしも得られないという問題がある。本研究では、これらの問題に対し①最適クラスタ数の自動決定、②従来法より高速、③クラスタ内でエッジが密・クラスタ間でエッジが疎、の3点を実現するクラスタリングモデルを提案・実装した。 (2) バイクラスタリングと呼ばれる遺伝子発現解析手法とその出力結果の解析を容易にするツールの開発を行った。バイクラスタリングは特定の実験条件下で共発現する遺伝子群を発見する手法として広く研究されており、近年では頻出アイテムセットマイニングを応用した手法が他手法に比べてパフォーマンスが高いことが示されている。しかしながら頻出アイテムセットマイニングに基づくアルゴリズムは冗長な出力をもつため個々の結果の解釈が困難になるという問題があった。本研究では、従来法では発見することが出来ない重要なバイクラスタも列挙し、結果を非冗長かつコンパクトな重み付きネットワーク構造に集約する手法を提案し実装して公開した。 以上の(1)(2)により糖鎖関連パスウェイの解析、及び、糖鎖遺伝子の解析を従来よりも容易に行うことを可能にした。
|