ゲノムに潜むシグナル・モチーフ部品の網羅的探索のための自己組織化地図
Project/Area Number |
15014231
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Biological Sciences
|
Research Institution | National Institute of Genetics |
Principal Investigator |
池村 淑道 国立遺伝学研究所, 集団遺伝研究系, 教授 (50025475)
|
Project Period (FY) |
2003
|
Project Status |
Completed (Fiscal Year 2003)
|
Budget Amount *help |
¥3,500,000 (Direct Cost: ¥3,500,000)
Fiscal Year 2003: ¥3,500,000 (Direct Cost: ¥3,500,000)
|
Keywords | 難培養性微生物 / 自己組織化地図 / SOM / 連続塩基頻度 / メタゲノム解析 / オリゴヌクレオチド頻度 / genome signature / ゲノム語辞書 |
Research Abstract |
1)ゲノム配列の解読が進んでいる約150種類のゲノム配列の全体に関して、5-8連塩基頻度のSOM解析を行い、各ゲノムにおいて特徴的な頻度で出現する連文字配列を明らかにした。回文型の配列類は生物種の特徴を顕著に反映する傾向にあった。1kb程度のヒトやマウスの断片配列をSOM解析すると、単一のゲノム内についても、UTR、CDS、イントロン領域等で明瞭に分離する傾向を示した。機能と関係するシグナル配列を探索する新規な情報学的な手段を提供できる。シグナルやモチーフ候補群が特定の組み合せで集中するゲノム部位の探索が行え、その組み合せの機能上の意味を解析することが可能になった。マウスのcDNAについては、protein-codingとnoncodingで分離する傾向にあった。 2)『Genome Word Dictionary』の構築に関して、SOM結果についての多量な画像や頻度データ、ならびに多数の文献データを、Oracleを用いてデータベース化した。現時点では、4連続塩基の全体について、収録を完了した。関係データベースであるので、生物種や系統ごとにも辞書が作成できる。各連続塩基配列別に文献類が収録されているので、シグナルやモチーフ配列を含む各連続塩基の機能的な意味を効率的に把握できる。 3)環境に生育する微生物の大半が実験室での培養が困難であり、未開拓なゲノム資源として残されてきた。培養せずに混合ゲノムDNA試料の配列決定を行う方法が普及してきた。SOMは生物種に関する予備知識なしに、断片配列の大半を生物系統に分類が可能である。10kb程度以上の配列が既知の、約1600の生物種の配列全体で作成したSOM上に、Venterらがバーミューダ沖の海水由来DNAから得た80万本の配列をマップしたところ、明瞭なクラスタリングが見られた。1kb程度の配列について、新規な系統推定法が確立できた。
|
Report
(1 results)
Research Products
(7 results)