Research Abstract |
本年度は,昨年,一昨年と積み上げてきた基礎理論の応用を中心に研究を行ってきた。特に,昨年度から今年度にかけて着想に至ったClassified Clusteringという新たな枠組みの応用を中心に行った。この手法は,従来から遺伝子の発現量解析に利用されてきた,クラスタリング,クラス分類の2手法を同時に行うものである。これによって,既存の実験で知られている多種多様な分類の中から,実験系を説明するのに適切な分類を発見することが可能になった。応用として,ひとつは,遺伝子の転写調節領域の発見がある。遺伝子の転写調節領域には,ユビキタスに働くものだけでなく,機能,状況特異的に働くものが知られている。特にこの転写調節を,発現量データを組み合わせ,Classified Clusteringを利用することで,発現量データの説明にふさわしい転写調節領域の組み合わせを選び出すことが可能となった。また,転写調節に留まらず詳細な遺伝子機能分類であるGene Ontologyの,どのTerm(属性)に属する遺伝子群が,特異的に発現調節が行われているかを,自動的に特定することが可能となった。これにより,発現量採取の実験を行った後,クラスタリングを行った後,どのクラスタが,どの機能を持っているか,という発現量解析で頻繁に使われる解析手法を用いた場合にハイコストな作業をさけ,自動的に,統計的に最も妥当なクラスタを採取することが可能となった。本手法は,遺伝子解析の範囲に留まらず,非常に一般的な手法のため,データマイニング手法への影響も広く期待され,更なる研究を進める余地が残っている。
|