Project/Area Number |
61216005
|
Research Category |
Grant-in-Aid for Special Project Research
|
Allocation Type | Single-year Grants |
Research Institution | Kyoto University |
Principal Investigator |
金久 實 京大, 化学研究所, 助教授 (70183275)
|
Project Period (FY) |
1986
|
Project Status |
Completed (Fiscal Year 1986)
|
Budget Amount *help |
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 1986: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | DNAデータベース / プロモーター / 判別分析 / 反復配列 |
Research Abstract |
核酸塩基配列から生物機能の発現に重要な部位のシグナルをコンピュータ解析で見いだすために、我々は同一の機能をもつ塩基配列の集合の特徴を定量化し、塩基配列と機能の間の経験的な法則を探している。以前に多変量データ解析の一方法である判別分析を用いて、メッセンジャーRNAのスプライシングが起こる部位を予測する試みを行なったが、本研究では同様の方法をDNAからRNAへの転写開始領域であるプロモーター部位の予測に用いた。これはいわゆるコンセンサス配列の他に、ヌクレオチド組成、特定のスクレオチドが周期的に現れる度合、DNAダブルヘリックスの局所的な変化を表す構造パラメターなどを組み合わせて、真のプロモーター部位を最もよく判別するような関数を作るのである。判別関数はスプライシングの場合ほどはよくならず、70%程度の判別にとどまった。 以上の多変量データ解析以外に、塩基配列の中に短い繰り返しがどのように出現しているか、データベースの統計解析も行なった。これはデータベースの高速ホモロジーサーチにも用いられているハッシュテーブルの方法を用いたもので、繰り返しの単位が1から20ヌクレオチド位までのものがどの程度続いているか、繰り返しの長さに対して出現頻度をプロットしてみた。すぐに予測されることであるが、タンパク質をコードする部分は周期が3の倍数のもの以外はほとんど繰り返しが見られない。ノンコーディングの部分は生物種により繰り返しの度合が大きく異なり、とくに哺乳類の配列データは繰り返しの単位が4から7のものについて統計的に顕著な特徴が見られた。
|