研究課題
自己組織化マップ(SOM)は教師なしニューラルネットワークアルゴリズムであり大量情報の全体像と部分情報の両方を効率的に把握できる。ゲノム配列の解読の進んだ約40種類の真核生物、ならびにゲノム配列の完全に解読された約250種類の原核生物のゲノム配列の全体に関して、3〜5連塩基頻度のSOM解析を行い、各ゲノムを特徴付ける連文字配列の出現パターンを明らかにした。4連や5連塩基頻度のSOM解析には長大な計算時間を必要とするが、海洋技術研究機構の地球シュミレータを使用できるようになったことで、大規模SOM解析が可能になった。1kb程度のヒトやマウスの断片配列をSOM解析すると、単一のゲノム内においても、遺伝子上流の転写制御領域、5'と3'UTR、CDS、イントロン領域の相互間で明瞭に分離する傾向を示した。また、これらの各グループ内でも複数のクラスターに分離する傾向を示した。機能と関係するシグナル塩基配列類の候補を探索する新規な情報学的な手段を提供できた。各生物のゲノムを特徴付ける連文字配列は、変異やその修復機構の性質を反映するだけでなく、機能的に重要なシグナルに対応する連文字配列が特徴的な出現頻度と分布を持つことにも関連していた。例えば、転写因子に対して高い配列依存性を示し、安定に結合するシグナル配列類は、ランダム配列からの予想値よりも低頻度に出現する傾向にあった。塩基配列が解読されるが、他の分子生物学の実験データに乏しいゲノムが急増する傾向にある。実験的な研究をin silico(計算機を用いた解析)で代行することが必須になる。塩基配列のみを用いて重要なシグナルが推定可能なSOMは、この目的に合致している。分子生物学の研究の進んだゲノムについて、SOM解析の知見を十分に集積しておけば、それらを基礎知識とすることで、新規なゲノムについてもシグナルの候補配列のin silico探索が可能となる。
すべて 2006 2005
すべて 雑誌論文 (6件)
Gene 365
ページ: 27-34
DNA Research 12
ページ: 281-290
Nature Biotechnology 23
ページ: 88-93
Proceedings of Workshop 2005 on Self-Organizing Maps, 2005
ページ: 669-676
Proceedings of Workshop 2005 on Self-Organizing maps 2005
ページ: 235-242
Canadian Journal of Microbiology 57
ページ: 251-259