研究概要 |
(1)新しい系統樹作成プログラムの開発:ヒトミトコンドリアDNAのDループ領域のように,多数の近縁な塩基配列データから迅速に系統樹を生成する目的でSST(Simultaneous Sequence Joining)法と名付けた一連のプログラムをC言語を用いて開発した。はじめにBLASTで高いホモロジーを持つ配列を集め,そのoutputからPIRフォーマットのファイルを生成する。これらはすでに互いに近縁であることが前提なので,多重整列することなく,ただちに配列の処理を行ない,blockフォーマット,inter leavedフォーマット,alignmentフォーマットというように,一連のファイルを生成してゆく。プログラムを工夫して,長大な配列が多数あっても処理に支障がないようにした。こうして,まず同一配列を除去し,その過程で各配列の出現頻度を計算する。次にsingleton変異と呼ぶ,樹形の決定に影響を与えない塩基サイトを除去する。この2回の処理で,多数の配列が同時に結合される。このようにして欠長性を捨てて圧縮された配列に対してさらに近縁結合アルゴリズムに似た方法で順次配列を結合してゆく。現在プロトタイププログラムをほぼ完成し,それに基ずく論文を準備中である。 (2)実際の分子データの解析:ヒトを中心とする霊長類のABO式血液型遺伝子の塩基配列データを分析し,論文を発表した(Saitou and Yamamoto,1997,Ogasawara et al.1996,1996)。また,哺乳類と他の脊椎動物のPOUIII転写制御印紙の塩基配列を分析した(Sumiyama et al,1996)。筋肉系の進化を解明するため,筋細胞で発現する7種類のタンパク質の系統樹を作成し,それらを重ね合わせる分析を行なった(現在論文を準備中)。 (3)系統樹作成法とその応用に関するふたつの総説を著わした(Saitou,1996,1996)。
|