研究課題
基盤研究(C)
教師なしニューラルネットワークアルゴリズムの自己組織化マップ(SOM)は大量情報の全体像と部分情報の両方を効率的に把握し、2次元上に可視化できる。ゲノム配列の解読の進んだ真核生物種、ならびにゲノム配列の完全に解読された原核生物の総計約300種のゲノム由来の10と100kbの断片化配列全体に関して、3〜5連塩基頻度のSOM解析を行い、各ゲノムを特徴付ける連文字配列の出現パターンを明らかにした。4連や5連塩基頻度のSOM解析には長時間を必要とするが、地球シュミレータを使用できるようになったことで、大規模SOMが可能になった。1kb程度のヒトやマウスの断片配列をSOM解析すると、単一のゲノム内においても、遺伝子上流の転写制御領域、5'と3'UTR、CDS、イントロン領域の相互間で明瞭に分離する傾向を示した。また、これらの各グループ内でも複数のクラスターに分離する傾向を示した。機能と関係するシグナル配列類の候補を探索する新規な情報学的な手段を提供できた。各生物のゲノムを特徴付ける連文字配列は、変異やその修復機構の性質を反映するだけでなく、機能的に重要なシグナルに対応する連文字配列が特徴的な出現頻度と分布を持つことにも関連していた。例えば、転写因子に対して高い配列依存性を示し、安定に結合するシグナル配列類は、ランダム配列からの予想値よりも低頻度に出現する傾向にあった。塩基配列が解読されるが、他の分子生物学の実験データに乏しいゲノムが急増する傾向にある。実験的な研究をin silicoで代行することが必須になる。塩基配列のみを用いて重要なシグナルが推定可能なSOMは、この目的に合致している。分子生物学の研究の進んだゲノムについて、SOM解析の知見を十分に集積しておけば、それらを基礎知識とすることで、新規なゲノムについてもシグナルの候補配列のin silico探索が可能となる。環境中の難培養性微生物類由来のゲノム断片の系統推定と生物多様性の解析も可能にした。
すべて 2006 2005
すべて 雑誌論文 (13件)
Gene 365
ページ: 27-34
Cytogenet Genome Res. 113
ページ: 130-137
DNA Research 12
ページ: 281-290
Nature Biotechnology 23
ページ: 88-93
Proceedings of Workshop 2005 Self-Organizing Maps 2005
ページ: 669-676
Proceedings of Workshop 2005 on Self-Organizing Maps 2005
ページ: 235-242
Canadian Journal of Microbiology 51
ページ: 251-259
Gene 346
ページ: 115-125
Proceedings of Workshop 2005 on Self-Organizing Maps
ページ: 187-194