研究課題/領域番号 |
61216005
|
研究種目 |
特定研究
|
配分区分 | 補助金 |
研究機関 | 京都大学 |
研究代表者 |
金久 實 京大, 化学研究所, 助教授 (70183275)
|
研究期間 (年度) |
1986
|
研究課題ステータス |
完了 (1986年度)
|
配分額 *注記 |
1,300千円 (直接経費: 1,300千円)
1986年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | DNAデータベース / プロモーター / 判別分析 / 反復配列 |
研究概要 |
核酸塩基配列から生物機能の発現に重要な部位のシグナルをコンピュータ解析で見いだすために、我々は同一の機能をもつ塩基配列の集合の特徴を定量化し、塩基配列と機能の間の経験的な法則を探している。以前に多変量データ解析の一方法である判別分析を用いて、メッセンジャーRNAのスプライシングが起こる部位を予測する試みを行なったが、本研究では同様の方法をDNAからRNAへの転写開始領域であるプロモーター部位の予測に用いた。これはいわゆるコンセンサス配列の他に、ヌクレオチド組成、特定のスクレオチドが周期的に現れる度合、DNAダブルヘリックスの局所的な変化を表す構造パラメターなどを組み合わせて、真のプロモーター部位を最もよく判別するような関数を作るのである。判別関数はスプライシングの場合ほどはよくならず、70%程度の判別にとどまった。 以上の多変量データ解析以外に、塩基配列の中に短い繰り返しがどのように出現しているか、データベースの統計解析も行なった。これはデータベースの高速ホモロジーサーチにも用いられているハッシュテーブルの方法を用いたもので、繰り返しの単位が1から20ヌクレオチド位までのものがどの程度続いているか、繰り返しの長さに対して出現頻度をプロットしてみた。すぐに予測されることであるが、タンパク質をコードする部分は周期が3の倍数のもの以外はほとんど繰り返しが見られない。ノンコーディングの部分は生物種により繰り返しの度合が大きく異なり、とくに哺乳類の配列データは繰り返しの単位が4から7のものについて統計的に顕著な特徴が見られた。
|