研究課題/領域番号 |
16570190
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
進化生物学
|
研究機関 | 総合研究大学院大学 |
研究代表者 |
池村 淑道 総合研究大学院大学, 葉山高等研究センター, 教授 (50025475)
|
研究分担者 |
洞田 慎一 総合研究大学院大学, 上級研究員 (70377125)
阿部 貴志 国立遺伝学研究所, 生命情報DDBJセンター, 助手 (30390628)
深川 竜郎 国立遺伝学研究所, 分子遺伝研究所, 助教授 (60321600)
|
研究期間 (年度) |
2004 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
2005年度: 1,000千円 (直接経費: 1,000千円)
2004年度: 2,600千円 (直接経費: 2,600千円)
|
キーワード | Self-Organizing Map / SOM / genome signature / phylogenetic prediction / 連続塩基出現頻度 / 地球シュミレータ / oligonucleotide / 難培養性微生物 / phylogenetic classification / oligonucleotide frequencies / オリゴヌクレオチド頻度 / 自己組織化マップ / 環境微生物 / 系統推定 / 連続塩基頻度 / ゲノム配列 |
研究概要 |
教師なしニューラルネットワークアルゴリズムの自己組織化マップ(SOM)は大量情報の全体像と部分情報の両方を効率的に把握し、2次元上に可視化できる。ゲノム配列の解読の進んだ真核生物種、ならびにゲノム配列の完全に解読された原核生物の総計約300種のゲノム由来の10と100kbの断片化配列全体に関して、3〜5連塩基頻度のSOM解析を行い、各ゲノムを特徴付ける連文字配列の出現パターンを明らかにした。4連や5連塩基頻度のSOM解析には長時間を必要とするが、地球シュミレータを使用できるようになったことで、大規模SOMが可能になった。1kb程度のヒトやマウスの断片配列をSOM解析すると、単一のゲノム内においても、遺伝子上流の転写制御領域、5'と3'UTR、CDS、イントロン領域の相互間で明瞭に分離する傾向を示した。また、これらの各グループ内でも複数のクラスターに分離する傾向を示した。機能と関係するシグナル配列類の候補を探索する新規な情報学的な手段を提供できた。 各生物のゲノムを特徴付ける連文字配列は、変異やその修復機構の性質を反映するだけでなく、機能的に重要なシグナルに対応する連文字配列が特徴的な出現頻度と分布を持つことにも関連していた。例えば、転写因子に対して高い配列依存性を示し、安定に結合するシグナル配列類は、ランダム配列からの予想値よりも低頻度に出現する傾向にあった。塩基配列が解読されるが、他の分子生物学の実験データに乏しいゲノムが急増する傾向にある。実験的な研究をin silicoで代行することが必須になる。塩基配列のみを用いて重要なシグナルが推定可能なSOMは、この目的に合致している。分子生物学の研究の進んだゲノムについて、SOM解析の知見を十分に集積しておけば、それらを基礎知識とすることで、新規なゲノムについてもシグナルの候補配列のin silico探索が可能となる。環境中の難培養性微生物類由来のゲノム断片の系統推定と生物多様性の解析も可能にした。
|