研究課題
ゲノム配列の解読の進んだ250生物種由来の1kbと10kbと100kbの断片化配列全体に関して、4〜6連塩基頻度のSOM解析を行い、各ゲノムを特徴付けるオリゴヌクレオチドの頻度パターンの実体、その特徴が形成されてきた進化過程、機能上の意味を解析した。8連続塩基については、次元数が高くなりすぎるので、回文型に着目した。各生物種について他生物種と比べて特徴的に低頻度ないしは高頻度に使用される連文字配列を網羅的に抽出した。本年度は、塩基組成から推定するよりも低頻度に出現するオリゴヌクレオチド配列を中心に解析したところ、そのゲノムが持つ制限酵素の切断配列以外に、重要な遺伝シグナルにも特徴的に低頻度出現するものが見られた。ゲノム配列の解読の進んだ脊椎動物類について、100kb断片化配列の3連と4連続塩基SOM解析をおこなったところ、ヒト、ウシ、イヌ、マウス、オポッサム、ニワトリ、フグ、ゼブラフィシュは、相互に高い分離を示した。分離能は3連よりは4連続塩基頻度の方が明瞭に高かった。多種類の難培養性微生物を含有する環境試料から直接にゲノムDNAの混合物を回収し、断片配列をクローン化し、配列決定を行う技術が開発されている。SOMは、生物種に関する予備知識なしに、オリゴヌクレオチドの頻度のみで、断片配列の生物種ごとのクラスタ化が可能であり、系統推定を可能にする。環境に生育する環境微生物の多様性を把握することを目標においた場合には、配列が完全に解読されたゲノムのみならず、断片的にしか配列が解読されていない生物種についても、その配列の特徴を予め把握しておくことが重要となる。10kb以上の配列が報告された1502の既知生物種の塩基配列の全体を対象に、4連塩基頻度のSOMを作成した。このSOM上へ、海水、地下水ならびにヒト腸内由来の新規断片配列をマップし、それらの系統推定を行った。
すべて 2005 2004
すべて 雑誌論文 (4件)
Nature Biotechnology 23
ページ: 88-93
Canadian Journal of Microbiology (In press)
Proceedings of the Institute of Statistical Mathematics 52
ページ: 207-215
Proceedings of Information-Based Induction Sciences
ページ: 94-99